使用python爬取网易云音乐(15行Python代码实现网易云热门歌单实例教程)
使用python爬取网易云音乐
15行Python代码实现网易云热门歌单实例教程0. 引言
马上314情人节就要来了,是否需要一首歌来抚慰你,受伤或躁动的心灵。来吧,今天教你用15行代码搞定热门歌单。学起来并听起来吧。
本文使用的是selenium模块,它是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下拉等等操作,对于一些 javascript 渲染的页面来说,此种抓取方式非常有效。另外采用了chrome浏览器配合selenium工作。
下面话不多说了,来一起看看详细的介绍吧
1. 环境
操作系统:windows
python版本:3.7.2
2. 准备工作
a. 若你的环境中没有selenium模块,直接使用pip安装即可。
|
pip install selenium |
b. 打开谷歌浏览器,检查chrome的版本:在浏览器地址中输入 chrome://settings/help 回车即可看到。
c. 打开chromedriver 的官方网站:
https://sites.google.com/a/ch...
寻找与你当前浏览器版本相对应的chromedriver下载。
d. 选择你自己的操作系统类型进行下载即可。
e. 以windows为例,下载结束后,将chromedriver 放置在python安装目录下的scripts文件夹即可。
准备工作完成,代码写起来吧~
3. 迷你爬虫的实现
我们这次的目标是爬取热门歌单,比如网易云音乐中播放量大于1000万的歌单信息(歌单名称、链接)。
a. 我们先来打开网易云的歌单第一页:
https://music.163.com/#/disco...
b. 使用chrome的开发者工具<f12>进行分析。
我们想要拿的信息全在这里:
- msk,封面[mask]:有歌单的名称及链接
- nb,播放数[number broadcast]:135万
c. 我们还需要遍历所有的页,使用工具继续分析,找到“下一页”的url。
d. 切换至最后一页,拿到最后一页的url。
e. 等我们爬取完所有符合的歌单信息后,将其保存在本地。
f. 全部工作结束,最后再通过下面的伪代码回顾下整体思路。
g. 爬取的效果如下:
4. 总结
本文旨在安抚你因情人节受伤的小心灵,同时带你入个爬虫的门,感受下python的强大。
好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对开心学习网的支持。
原文链接:https://segmentfault.com/a/1190000018448203
- python读取word的表格(Python使用reportlab模块生成PDF格式的文档)
- python中什么是迭代器(一篇文章彻底搞懂Python中可迭代Iterable、迭代器Iterator与生成器Generator的概)
- python 游戏开发实例(python实现诗歌游戏类继承)
- pythonzipfile的用法(对Python之gzip文件读写的方法详解)
- zabbix sender能否发送告警数据(python3实现zabbix告警推送钉钉的示例)
- python 微信发天气信息(python微信聊天机器人改进版定时或触发抓取天气预报、励志语录等,向好友推送)
- python编写程序读写数据库(详解js文件通过python访问数据库方法)
- python有哪几种赋值(关于python多重赋值的小问题)
- python中的1和0(python把1变成01的步骤总结)
- python3安装编程环境(Python3 修改默认环境的方法)
- python3.9.1如何安装模块(Python3.6中Twisted模块安装的问题与解决)
- python爬取百度搜索pdf文档(Python实现的爬取百度文库功能示例)
- 如何对python中列表中的数据运算(Python3.5集合及其常见运算实例详解)
- python3有哪些内置模块(Python3.5内置模块之os模块、sys模块、shutil模块用法实例分析)
- python获取字符串类型(python3利用ctypes传入一个字符串类型的列表方法)
- python编程将一个三位数反序输出(python实现整数的二进制循环移位)
- SCI检索 SSCI检索 EI检索 ISTP检索 CSCD检索简介(SCI检索SSCI检索EI检索)
- 参考文献里期刊名称的写法,你知道吗(参考文献里期刊名称的写法)
- 硕博期刊 SCI SSCI CSSCI分不清 一文带你看懂主流期刊分类(硕博期刊SCISSCI)
- 辱华品牌新百伦官宣新代言人IU,个别粉丝希望get爱豆同款(辱华品牌新百伦官宣新代言人IU)
- 巅峰时期被爆床照,曾被选国民最讨厌女星,IU不为人知的黑历史(巅峰时期被爆床照)
- 每天1万吨牛奶倒进下水道,美国大萧条一幕重现(每天1万吨牛奶倒进下水道)
热门推荐
- 如何认识服务器(关于Nginx、Apache、Tomcat三个WEB服务器的区别和认知)
- js 出现cannot find function(Fatal error: Call to a member function read on a non-object in 错误解决方法)
- 单元格内容过多超出怎么办(单元格内文本显示超过单元格宽度的快速解决办法)
- html标签的嵌套规则
- 织梦cms内容模型管理详解(织梦CMS系统TAG标签页面包屑导航的调用方法)
- python删除list的指定元素(Python list列表中删除多个重复元素操作示例)
- web接口测试中需要测试的几个点
- 云服务器安全保障(云服务器怎么保证信息安全?)
- tomcat启动慢什么原因(Tomcat服务器响应过慢解决方案)
- docker镜像无法删除 Error:No such image:xxxxxx解决(docker镜像无法删除 Error:No such image:xxxxxx解决)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9