python爬虫模块教程(Python爬虫之UserAgent的使用实例)
类别:脚本大全 浏览量:1794
时间:2022-01-26 01:02:03 python爬虫模块教程
Python爬虫之UserAgent的使用实例问题: 在Python爬虫的过程中经常要模拟UserAgent, 因此自动生成UserAgent十分有用, 最近看到一个Python库(fake-useragent),可以随机生成各种UserAgent, 在这里记录一下, 留给自己爬虫使用。
安装 pip install fake-useragent
使用案例
基本使用
|
from fake_useragent import UserAgent ua = UserAgent() ua.ie # Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US); ua.msie # Mozilla/5.0 (compatible; MSIE 10.0; Macintosh; Intel Mac OS X 10_7_3; Trident/6.0)' ua[ 'Internet Explorer' ] # Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; GTB7.4; InfoPath.2; SV1; .NET CLR 3.3.69573; WOW64; en-US) ua.opera # Opera/9.80 (X11; Linux i686; U; ru) Presto/2.8.131 Version/11.11 ua.chrome # Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, like Gecko) Chrome/22.0.1216.0 Safari/537.2' ua.google # Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1290.1 Safari/537.13 ua[ 'google chrome' ] # Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11 ua.firefox # Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1 ua.ff # Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:15.0) Gecko/20100101 Firefox/15.0.1 ua.safari # Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25 # and the best one, random via real world browser usage statistic ua.random |
注意:
fake-useragent 将收集到的数据缓存到temp文件夹, 例如 /tmp, 更新数据:
|
from fake_useragent import UserAgent ua = UserAgent() ua.update() |
有时候会因为网络或者其他问题,出现异常(fake_useragent.errors.FakeUserAgentError: Maximum amount of retries reached
), 可以禁用服务器缓存(从这里踩了一个坑, 没仔细看文档的锅):
|
from fake_useragent import UserAgent ua = UserAgent(use_cache_server = False ) |
可以自己添加本地数据文件(v0.1.4+)
|
import fake_useragent # I am STRONGLY!!! recommend to use version suffix location = '/home/user/fake_useragent%s.json' % fake_useragent.VERSION ua = fake_useragent.UserAgent(path = location) ua.random |
其他功能用到的也不是很多,详细见文档吧。
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对开心学习网的支持。如果你想了解更多相关内容请查看下面相关链接
原文链接:https://blog.csdn.net/anonymous_qsh/article/details/79349068
您可能感兴趣
- python出现modify怎么办(解决Python找不到ssl模块问题 No module named _ssl的方法)
- 用python制作一个简单的小程序(Python简单基础小程序的实例代码)
- pythondict排序原理(Python标准库使用OrderedDict类的实例讲解)
- python内置函数一览表(Python面向对象程序设计构造函数和析构函数用法分析)
- python一分钟认识条件判断(对python判断ip是否可达的实例详解)
- pythonlist列表讲解(Python中将两个或多个list合成一个list的方法小结)
- python定时推送邮件(python实现定时压缩指定文件夹发送邮件)
- python代码计算一个月多少天(Python计算时间间隔精确到微妙的代码实例)
- python菜单栏中常用的菜单(Python3实现的简单三级菜单功能示例)
- python将一个字符串逆序输出(Python字符串逆序的实现方法一题多解)
- python中字符串截取规则(Python中的字符串切片截取字符串的详解)
- pythonindex函数用法(python sort、sort_index方法代码实例)
- python创建字典的代码(Python创建字典的八种方式)
- python中读取文件怎么操作(Python实现的读取文件内容并写入其他文件操作示例)
- pythonai识别算法(Python3调用百度AI识别图片中的文字功能示例测试可用)
- python零基础入门详细教程(Python零基础入门学习之输入与输出)
- 哪版孙悟空最萌 黄渤躺萌了(哪版孙悟空最萌)
- 融入小人物的喜怒哀乐,黄渤饰演的角色为什么让人观看时欲罢不能(融入小人物的喜怒哀乐)
- 《极限挑战》深访都市夜归人,夜间打工者体验,黄磊录完憔悴了(极限挑战深访都市夜归人)
- Google 推出了一个游戏生成器,让不会编程的你也能自己设计游戏(推出了一个游戏生成器)
- 二胎家庭老大爱闹情绪,用这招很有效(二胎家庭老大爱闹情绪)
- 一个30岁男人外遇失败的全过程(一个30岁男人外遇失败的全过程)
热门推荐
- thinkphp中view视图的作用(Thinkphp5.0框架视图view的模板布局用法分析)
- sql常见的聚合函数有哪些(SQL中的开窗函数详解可代替聚合函数使用)
- python中的变量与变量类型(Python变量类型知识点总结)
- mysql执行计划详细解读(详解MySQL的Seconds_Behind_Master)
- 如何实现让dede三级栏目数据调用(dede调取三级栏目名及栏目下的内容列表的方法)
- 零基础学php好吗(零基础php编程好学吗)
- visual studio怎么连接数据库(使用Visual Studio Code连接MySql数据库并进行查询)
- mongodb基本数据类型
- elementui自定义坐标(element-ui 上传图片后标注坐标点)
- css3渐变背景图片(css3实现背景图片半透明内容不透明的方法示例)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9