pythonweb大数据分析(Python实现的大数据分析操作系统日志功能示例)
类别:脚本大全 浏览量:2383
时间:2022-03-29 18:58:26 pythonweb大数据分析
Python实现的大数据分析操作系统日志功能示例本文实例讲述了Python实现的大数据分析操作系统日志功能。分享给大家供大家参考,具体如下:
一 代码
1、大文件切分
|
import os import os.path import time def FileSplit(sourceFile, targetFolder): if not os.path.isfile(sourceFile): print (sourceFile, ' does not exist.' ) return if not os.path.isdir(targetFolder): os.mkdir(targetFolder) tempData = [] number = 1000 fileNum = 1 linesRead = 0 with open (sourceFile, 'r' ) as srcFile: dataLine = srcFile.readline().strip() while dataLine: for i in range (number): tempData.append(dataLine) dataLine = srcFile.readline() if not dataLine: break desFile = os.path.join(targetFolder, sourceFile[ 0 : - 4 ] + str (fileNum) + '.txt' ) with open (desFile, 'a+' ) as f: f.writelines(tempData) tempData = [] fileNum = fileNum + 1 if __name__ = = '__main__' : #sourceFile = input('Input the source file to split:') #targetFolder = input('Input the target folder you want to place the split files:') sourceFile = 'test.txt' targetFolder = 'test' FileSplit(sourceFile, targetFolder) |
2、Mapper代码
|
import os import re import threading import time def Map (sourceFile): if not os.path.exists(sourceFile): print (sourceFile, ' does not exist.' ) return pattern = re. compile (r '[0-9]{1,2}/[0-9]{1,2}/[0-9]{4}' ) result = {} with open (sourceFile, 'r' ) as srcFile: for dataLine in srcFile: r = pattern.findall(dataLine) if r: t = result.get(r[ 0 ], 0 ) t + = 1 result[r[ 0 ]] = t desFile = sourceFile[ 0 : - 4 ] + '_map.txt' with open (desFile, 'a+' ) as fp: for k, v in result.items(): fp.write(k + ':' + str (v) + '\n' ) if __name__ = = '__main__' : desFolder = 'test' files = os.listdir(desFolder) #如果不使用多线程,可以直接这样写 '''for f in files: Map(desFolder + '\\' + f)''' #使用多线程 def Main(i): Map (desFolder + '\\' + files[i]) fileNumber = len (files) for i in range (fileNumber): t = threading.Thread(target = Main, args = (i,)) t.start() |
3.Reducer代码
|
import os def Reduce (sourceFolder, targetFile): if not os.path.isdir(sourceFolder): print (sourceFolder, ' does not exist.' ) return result = {} #Deal only with the mapped files allFiles = [sourceFolder + '\\'+f for f in os.listdir(sourceFolder) if f.endswith(' _map.txt')] for f in allFiles: with open (f, 'r' ) as fp: for line in fp: line = line.strip() if not line: continue position = line.index( ':' ) key = line[ 0 :position] value = int (line[position + 1 :]) result[key] = result.get(key, 0 ) + value with open (targetFile, 'w' ) as fp: for k,v in result.items(): fp.write(k + ':' + str (v) + '\n' ) if __name__ = = '__main__' : Reduce ( 'test' , 'test\\result.txt' ) |
二 运行结果
依次运行上面3个程序,得到最终结果:
07/10/2013:4634
07/16/2013:51
08/15/2013:3958
07/11/2013:1
10/09/2013:733
12/11/2013:564
02/12/2014:4102
05/14/2014:737
希望本文所述对大家Python程序设计有所帮助。
原文链接:https://blog.csdn.net/chengqiuming/article/details/78601136
您可能感兴趣
- python opencv 标记目标(使用Python的OpenCV模块识别滑动验证码的缺口推荐)
- python 暗弱目标提取(Python提取频域特征知识点浅析)
- python迭代列表解析(Python可迭代对象操作示例)
- python的多线程比多进程效率高(Python中单线程、多线程和多进程的效率对比实验实例)
- python中list用法(Python数据类型之List列表实例详解)
- 如何用python爬取最新电影(详解Python爬取并下载《电影天堂》3千多部电影)
- python微信红包分配(PHP切割整数工具类似微信红包金额分配的思路详解)
- python爬虫request方法介绍(详解Python3网络爬虫二:利用urllib.urlopen向有道翻译发送数据获得翻译结果)
- python实现七个基本算法(python实现维吉尼亚算法)
- python虚拟变量教程(Python中psutil的介绍与用法)
- python列表切片和分片(Python列表切片操作实例总结)
- python云服务技术(Python脚本修改阿里云的访问控制列表的方法)
- python的模块与包与库(Python 中包/模块的 `import` 操作代码)
- python标准库操作键盘(Python中捕获键盘的方式详解)
- python 循环遍历新方法(python for 循环获取index索引的方法)
- python的opencv图片识别(OpenCV-Python 摄像头实时检测人脸代码实例)
- 营养餐是什么(学校营养餐是什么)
- 谁说女子不如男 范冰冰演的武则天只是其一,另外两位你认识吗(谁说女子不如男)
- 杯酒人生---瓦伦丁酒杯和奥丁格啤酒(杯酒人生---瓦伦丁酒杯和奥丁格啤酒)
- 中秋节买啤酒,预算超过7元试试这8种啤酒,麦香浓郁都是真啤酒(预算超过7元试试这8种啤酒)
- CellPress旗下的6 期刊,国人友刊来了解一下吧(CellPress旗下的6期刊国人友刊来了解一下吧)
- ()
热门推荐
- dede内容模型管理(Dede网站修改模板路径的方法 拒绝模板泄漏被盗)
- js图片水印库(js给图片打马赛克的方法示例)
- centos zabbix服务端(centos7.9安装zabbix5.0.14及配置过程)
- laravel获取访问来路的函数(Laravel实现搜索的时候分页并携带参数)
- python中递归方法(Python中最大递归深度值的探讨)
- nginx文件夹限制ip访问(基于Nginx实现限制某IP短时间访问次数)
- photoshop常用快捷键
- python爬虫经典步骤(详解python爬虫系列之初识爬虫)
- dbcc checkdb 用法
- python做了一个自动翻译的小工具(Python 20行简单实现有道在线翻译的详解)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9