pythonrequest包设置编码(解决python3中的requests解析中文页面出现乱码问题)
类别:脚本大全 浏览量:1792
时间:2021-10-16 00:28:11 pythonrequest包设置编码
解决python3中的requests解析中文页面出现乱码问题第一部分 关于requests库
(1) requests是一个很实用的python http客户端库,编写爬虫和测试服务器响应数据时经常会用到。
(2) 其中的request对象在访问服务器后会返回一个response对象,这个对象将返回的http响应字节码保存到content属性中。
(3) 但是如果你访问另一个属性text时,会返回一个unicode对象,乱码问题就会常常发成在这里。
(4) 因为response对象会通过另一个属性encoding来将字节码编码成unicode,而这个encoding属性居然是responses自己猜出来的。
第二部分 解决方法
所以要么你直接使用content(字节码),要么记得把encoding设置正确,比如我获取了一段gbk编码的网页,就需要以下方法才能得到正确的unicode。
|
import requests url = "http://xxx.xxx.xxx" response = requests.get(url) response.encoding = 'gbk' print (response.text) |
总结
以上所述是小编给大家介绍的解决python3中的requests解析中文页面出现乱码问题,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!原文链接:https://segmentfault.com/a/1190000018917931
您可能感兴趣
- pythonrequest包设置编码(解决python3中的requests解析中文页面出现乱码问题)
- Asp.net导出Excel乱码
- dedecms搬家乱码(dedecms 的cn_substr_utf8字符串截取函数商榷)
- dedecms命名规则(dedecms utf-8 出现乱码问题的解决方法之一)
- apache错误编码代码(关于Apache默认编码错误 导致网站乱码的解决方案)
- python中encode中文自定义编码(详解Python解决抓取内容乱码问题decode和encode解码)
- linux 安装securecrt(Linux SecureCRT显示乱码解决方案)
- markdown和python的关系(解决python Markdown模块乱码的问题)
- idea向数据库中插入中文报错(Idea连接MySQL数据库出现中文乱码的问题)
- php换行乱码(php输出文字乱码的解决方法)
- webclient乱码
- Asp.net页面传值乱码
- idea调试怎么配置tomcat(如何提升Idea启动速度与Tomcat日志乱码问题)
- Extjs中文乱码
- tomcat配置远程调试(一次tomcat源码启动控制台中文乱码的调试过程记录)
- url编码及解码(伪静态URL中文乱码问题解决方法)
- 怎么做好SEO(怎么做好seo内容优化)
- 冬季钓鱼子线用 长 还是 短(冬季钓鱼子线用)
- 鱼竿 夏钓短,冬钓长 ,一定是这样 认清优缺点在选竿(鱼竿夏钓短冬钓长)
- 鲢鳙钓底还是钓浮 流水的水域应怎样做钓(鲢鳙钓底还是钓浮)
- 入秋后的第二场苹果发布会来了 全新M1系列芯片登场(入秋后的第二场苹果发布会来了)
- 苹果正式发布自研芯片M1 5nm 32核心 彻底放弃Intel(苹果正式发布自研芯片M1)
热门推荐
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9