python读取文件的正确方法(强悍的Python读取大文件的解决方案)
类别:脚本大全 浏览量:1938
时间:2022-03-28 01:03:54 python读取文件的正确方法
强悍的Python读取大文件的解决方案Python 环境下文件的读取问题,请参见拙文 Python基础之文件读取的讲解
这是一道著名的 Python 面试题,考察的问题是,Python 读取大文件和一般规模的文件时的区别,也即哪些接口不适合读取大文件。
1. read() 接口的问题
|
f = open (filename, 'rb' ) f.read() |
我们来读取 1 个 nginx 的日至文件,规模为 3Gb 大小。read() 方法执行的操作,是一次性全部读入内存,显然会造成:
MemoryError
...
也即会发生内存溢出。
2. 解决方案:转换接口
- (1)readlines() :读取全部的行,构成一个 list,实践表明还是会造成内存的问题;
|
for line in f.reanlines(): ... |
- (2)readline():每次读取一行,
|
while True : line = f.readline() if not line: break |
- (3)read(1024):重载,指定每次读取的长度
|
while True : block = f.read( 1024 ) if not block: break |
3. 真正 Pythonic 的方法
真正 Pythonci 的方法,使用 with 结构:
|
with open (filename, 'rb' ) as f: for line in f: <do something with the line> |
对可迭代对象 f,进行迭代遍历:for line in f
,会自动地使用缓冲IO(buffered IO)以及内存管理,而不必担心任何大文件的问题。
There should be one – and preferably only one – obvious way to do it.
Reference
How to read large file, line by line in python
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对开心学习网的支持。如果你想了解更多相关内容请查看下面相关链接
原文链接:https://blog.csdn.net/lanchunhui/article/details/51581540
您可能感兴趣
- 如何使用github中的python库(使用GitHub和Python实现持续部署的方法)
- python读取文件的方法和区别(浅谈PYTHON 关于文件的操作)
- python规定输入值的最大值(实例讲解Python中整数的最大值输出)
- pythonsocket建立多用户通讯(Python socket实现多对多全双工通信的方法)
- python3爬虫实例代码(python3通过selenium爬虫获取到dj商品的实例代码)
- pythonpickle使用方法(Python supervisor强大的进程管理工具的使用)
- python中的类和对象的定义和使用(Python类的继承、多态及获取对象信息操作详解)
- 浅谈Python3中strip()、lstrip()、rstrip()用法详解(浅谈Python3中strip、lstrip、rstrip用法详解)
- python爬取酷狗收费音乐(python爬取酷狗音乐排行榜)
- python下载后依然打不开文件(解决python打不开文件文件不存在的问题)
- python字符串相似度匹配(Python实现字符串匹配的KMP算法)
- python中导入模块的命令(Python3 导入上级目录中的模块实例)
- python列表精讲33节(Python列表知识应知应会)
- python分割字符串要用哪一个语句(python使用threading.Condition交替打印两个字符)
- python 获取数组任意组合(Python实现求两个数组交集的方法示例)
- python怎么爬取excel数据(python爬取内容存入Excel实例)
- 蓝底证件照怎么制作 证件照换底色 换尺寸快速搞定(蓝底证件照怎么制作)
- 你喜欢足球吗 足球如何点亮世界的(足球如何点亮世界的)
- 不可分鸽是什么梗(不可分鸽是什么梗)
- 古代的鸽子是爱情的象征,并非和平的使者(古代的鸽子是爱情的象征)
- 一课译词 放鸽子(一课译词放鸽子)
- 终于来了,淘宝更改账户名测试中,快去看看你能不能修改(淘宝更改账户名测试中)
热门推荐
- css三栏布局详解(CSS三列布局的多种表现形式)
- docker rabbitmq集群部署(Docker部署rabbitmq遇到的两个问题)
- docker数据库如何初始化(Docker启动PostgreSQL时创建多个数据库的解决方案)
- python字典的key(Python使用dict.fromkeys快速生成一个字典示例)
- canvas绘图白屏或者元素有缺失(高清屏中使用Canvas绘图出现模糊的问题及解决方法)
- python 循环遍历新方法(python for 循环获取index索引的方法)
- easyui messager的用法
- python的pickle用法(Python multiprocess pool模块报错pickling error问题解决方法分析)
- 用mysql编写test数据库(MySQL制作具有千万条测试数据的测试库的方法)
- python关于微信的模块(python基于itchat模块实现微信防撤回)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9