python爬虫入门代码(python爬虫基础教程:requests库二代码实例)
类别:脚本大全 浏览量:872
时间:2021-10-20 08:35:47 python爬虫入门代码
python爬虫基础教程:requests库二代码实例get请求
简单使用
|
import requests ''' 想要学习python?python学习交流群:973783996满足你的需求,资料都已经上传群文件,可以自行下载! ''' response = requests.get( "https://www.baidu.com/" ) #text返回的是unicode的字符串,可能会出现乱码情况 # print(response.text) #content返回的是字节,需要解码 print (response.content.decode( 'utf-8' )) # print(response.url) #https://www.baidu.com/ # print(response.status_code) #200 # print(response.encoding) #iso-8859-1 |
添加headers和params
|
import requests params = { 'wd' : 'python' } headers = { 'user-agent' : 'mozilla/5.0 (windows nt 6.1; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/64.0.3282.140 safari/537.36' } response = requests.get( "https://www.baidu.com/s" ,params = params,headers = headers) #content返回的是字节,需要解码 with open ( 'baidu.html' , 'w' ,encoding = 'utf-8' ) as f: f.write(response.content.decode( 'utf-8' )) |
post请求
爬去拉钩网职位信息
|
import requests url = "https://www.lagou.com/jobs/positionajax.json?city=%e5%8c%97%e4%ba%ac&needaddtionalresult=false" data = { 'first' : 'true' , 'pn' : 1 , 'kd' : 'python' } headers = { "user-agent" : "mozilla/5.0 (windows nt 6.1; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/64.0.3282.140 safari/537.36" , "referer" : "https://www.lagou.com/jobs/list_python?city=%e5%8c%97%e4%ba%ac&cl=false&fromsearch=true&labelwords=&suginput=" } response = requests.post(url,data = data,headers = headers) # print(response.text) print ( type (response.text)) #<class 'str'> print ( type (response.json())) #<class 'dict'> print (response.json()) #获取为字典的形式 |
使用代理
|
import requests proxy = { 'http' : '115.210.31.236.55:9000' } response = requests.get( "https://www.baidu.com/" ,proxies = proxy) print (response.content.decode( 'utf-8' )) |
session登录
|
# _*_ coding:utf-8 _*_ import requests # 1. 创建session对象,可以保存cookie值 ssion = requests.session() # 2. 处理 headers headers = { 'user-agent' : 'mozilla/5.0 (windows nt 6.1; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/60.0.3112.101 safari/537.36' } # 3. 需要登录的用户名和密码 data = { "email" : "158xxxxxxxx" , "password" : "pythonxxxxxxx" } # 4. 发送附带用户名和密码的请求,并获取登录后的cookie值,保存在ssion里 ssion.post( "http://www.renren.com/plogin.do" , data = data) # 5. ssion包含用户登录后的cookie值,可以直接访问那些登录后才可以访问的页面 response = ssion.get( "http://zhibo.renren.com/news/108" ) # 6. 打印响应内容 print (response.text) |
以上所述是小编给大家介绍的python爬虫基础教程:requests库(二)详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持!
原文链接:https://blog.csdn.net/fei347795790/article/details/89153257
您可能感兴趣
- python线程池有几种(对python 多线程中的守护线程与join的用法详解)
- python中的time时间模块使用知识(python实现简单日期工具类)
- 微信公众号文章 爬虫(python抓取搜狗微信公众号文章)
- python模块化打包(python使用Paramiko模块实现远程文件拷贝)
- pythonqt入门教程(使用python实现mqtt的发布和订阅)
- python面向对象的介绍(Python面向对象思想与应用入门教程类与对象)
- python dict 操作(Python中dict和set的用法讲解)
- python爬虫入门自学(自学python爬虫的建议和周期预算)
- python指定参数教程(详解Python传入参数的几种方法)
- centos7上安装python(centos6.5安装python3.7.1之后无法使用pip的解决方案)
- python自定义定时任务(python的schedule定时任务模块二次封装方法)
- python字典的值排序(python 对字典按照value进行排序的方法)
- python画折线图(python使用Plotly绘图工具绘制水平条形图)
- python 多进程读取文件(Python实现的多进程拷贝文件并显示百分比功能示例)
- python第三方库的使用方法和作用(Python第三方库face_recognition在windows上的安装过程)
- python实现最简单的游戏(20行python代码的入门级小游戏的详解)
- 痴情男神 吴彦祖 与妻子恋爱8年,结婚10年,家庭幸福美满(痴情男神吴彦祖)
- 成功破圈,小牛电动SQi强势开 跨(小牛电动SQi强势开)
- 挑战新国标电自天花板,九号机械师MMAX 110P深度体验(挑战新国标电自天花板)
- 《满江红》不要只当电影看,学生应该这样做(满江红不要只当电影看)
- 电影《民间怪谈录之走阴人》定档8月5日,开启一场中式惊悚之旅(电影民间怪谈录之走阴人定档8月5日)
- 原创图画书,以儿童视角讲述中国故事(以儿童视角讲述中国故事)
热门推荐
- css样式功能表能兼容所有浏览器吗(比较全的CSS浏览器兼容问题整理总结)
- python中字典的常用操作(11个Python3字典内置方法大全与示例汇总)
- pytorch入门与实战(详解PyTorch基本操作)
- 阿里云ecs实例详解(阿里云ecs服务器 修改php上传最大限制的方法)
- sql server性能调优(SQL Server性能调优之缓存)
- sql server 视图操作(Sql Server 视图数据的增删改查教程)
- phpsession方法(PHP SESSION机制的理解与实例)
- thinkphp返回json(thinkphp5框架实现数据库读取的数据转换成json格式示例)
- dedecms后台账号(dedecms实现首页顶部会员登陆框的方法)
- navicat配置远程访问mysql(解决Navicat无法连接 VMware中Centos系统中的 MySQL服务器的问题)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9