python提取json数据(Python爬取数据保存为Json格式的代码示例)
类别:脚本大全 浏览量:2226
时间:2021-10-19 06:20:04 python提取json数据
Python爬取数据保存为Json格式的代码示例python爬取数据保存为json格式
代码如下:
|
#encoding:'utf-8' import urllib.request from bs4 import beautifulsoup import os import time import codecs import json #找到网址 def getdatas(): # 伪装 header = { 'user-agent' : "mozilla/5.0 (x11; cros i686 2268.111.0) applewebkit/536.11 (khtml, like gecko) chrome/20.0.1132.57 safari/536.11" } # url="https://movie.douban.com/top250" url = "file:///e:/scrapy/2018-04-27/movie/movie.html" ret = urllib.request.request(url = url,headers = header) # 打开网页 res = urllib.request.urlopen(ret) # 转化格式 response = beautifulsoup(res, 'html.parser' ) # 找到想要数据的父元素 datas = response.find_all( 'li' ,{ 'class' : 'item' }) # print(datas) #创建存放数据的文件夹 folder_name = "output" if not os.path.exists(folder_name): os.mkdir(folder_name) # 定义文件 current_time = time.strftime( '%y-%m-%d' ,time.localtime()) file_name = "move" + current_time + ".json" # 文件路径 file_path = folder_name + "/" + file_name for item in datas: # print(item) dict1 = {} dict1[ 'rank' ] = item.find( 'li' ,{ 'class' : 'pic' }).find( 'em' ).get_text() dict1[ 'title' ] = item.find( 'li' ,{ 'class' : 'info' }).find( 'li' ,{ 'class' : 'hd' }).find( 'a' ).find( 'span' ,{ 'class' : 'title' }).get_text() dict1[ 'picurl' ] = item.find( 'li' ,{ 'class' : 'pic' }).find( 'a' ).find( 'img' ).get( 'src' ) # print(picurl) # 保存数据为json格式 try : with codecs. open (file_path, 'a' ,encoding = "utf-8" ) as fp: fp.write(json.dumps(dict1,ensure_ascii = false) + ",\n" ) except ioerror as err: print ( 'error' + str (err)) finally : fp.close() pass getdatas() # 爬取数据 |
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对开心学习网的支持。如果你想了解更多相关内容请查看下面相关链接
原文链接:https://blog.csdn.net/zhanghl150426/article/details/82022339
您可能感兴趣
- python能把时间转化成毫秒级吗(python 获取毫秒数,计算调用时长的方法)
- python中赋值语句规则(Python动态赋值的陷阱知识点总结)
- python代码返回值(Python 函数返回值的示例代码)
- python微信红包代码(php生成微信红包数组的方法)
- python怎么自动刷抖音(python实现抖音点赞功能)
- pythonexcel生成报表(python生成每日报表数据Excel并邮件发送的实例)
- python3有哪些内置模块(Python3.5内置模块之os模块、sys模块、shutil模块用法实例分析)
- python提取json数据(Python爬取数据保存为Json格式的代码示例)
- python3.7保存文件(详解用python实现基本的学生管理系统文件存储版python3)
- python列表切片和分片(Python列表切片操作实例总结)
- pythonlist类型教程(Python List cmp知识点总结)
- python基本数据结构(浅谈Python编程中3个常用的数据结构和算法)
- python面向对象实例教程(Python面向对象程序设计类的多态用法详解)
- 如何对python中列表中的数据运算(Python3.5集合及其常见运算实例详解)
- python基础教程常用函数整理(Python基础之函数的定义与使用示例)
- python 正则表达式在代码里的使用(python中正则表达式与模式匹配)
- 潘长江小品《照亮全家福》台词剧本完整版(潘长江小品照亮全家福台词剧本完整版)
- 一窗通办政务服务小品剧本(一窗通办政务服务小品剧本)
- 刘韬涛丁子贺小品《根治低头族》台词剧本(刘韬涛丁子贺小品根治低头族台词剧本)
- 看完《夺冠》,黄渤的演技我实在夸不起来,彭昱畅反令人惊喜(黄渤的演技我实在夸不起来)
- 黄渤泪目 我的痴呆父亲,我内心永远的痛(黄渤泪目我的痴呆父亲)
- 蒜苔和鱿鱼尾巴一起炒,味道特别棒,又脆又嫩,有滋又有味(蒜苔和鱿鱼尾巴一起炒)
热门推荐
- pycharm如何自定义模板(对Pycharm创建py文件时自定义头部模板的方法详解)
- php如何将数组清空(PHP实现数组向任意位置插入,删除,替换数据操作示例)
- asp的定义和意义(小旋风ASPWEBServer是什么?有什么作用?)
- canvas画法教学(手把手教你实现一个canvas智绘画板的方法)
- dockertomcat多开实例(Docker tomcat的设置内存大小配置方式)
- angular模块的组成(详解Angular结构型指令模块和样式)
- docker镜像简介(详解使用阿里云镜像仓库构建国外Docker镜像)
- laravel 后台管理框架(laravel-admin 管理平台获取当前登陆用户信息的例子)
- docker重启报错(Docker启动为Exited状态)
- 数据库设计的几个建议
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9