python 抓取youtube的(用Python批量抓取B站小姐姐的舞蹈)
大家好,我是菜鸟哥!周末宅在家没有事情,只能看看动漫,逛逛B站。
最近,菜鸟哥都在B站上欣赏小小姐姐的舞蹈视频,像是“欣小萌”、“慕慕有奶糖”等UP主都是菜鸟哥的关注对象。菜鸟哥只是单纯地从舞蹈欣赏的角度,来观看小姐姐们的舞蹈视频。
刚好,菜鸟哥也已经好久没有为大家奉上福利了,今天,就带领大家,来批量抓取小姐姐们的舞蹈视频,让大家一次看个够。
01.抓取视频子页面地址接下来的内容,我们将以“欣小萌”的视频抓取为例进行。
首先,我们打开舞蹈视频的主页,可以看到所有的舞蹈视频内容。
看到这样的界面,熟悉菜鸟哥之前文章的小伙伴们也大概知道抓取的流程。通过F12,打开开发者模式,然后再“network”下,找到以“search?mid=”开头的链接。点进去后,就可以看到舞蹈视频的关键信息内容。
我们需要抓取的就是bvid数据,通过这个数据,便可以构建每个舞蹈视频的链接,例如:bilibili/video/BV1uR4y1G7bd。
当然,我们的程序可以借鉴之前菜鸟哥同大家分享的(这里贴上扬名立万的链接)程序,来抓取每个舞蹈视频的bvid数据。
上述程序的内容分析,也可以借鉴之前分享的文章。获取到bvid数据后,接下来我们就来分析如何下载视频到本地。
上述的程序中,是视频提取程序的入口函数。
第7行程序,首先提取出链接地址当中的BV数据,也即bvid数值。
第8行程序,利用get_cid函数,获取cid的数据;
第9行程序,利用get_list函数,来获取视频的链接地址。
第11-15行程序,通过requests库抓取视频写入到本地。
上述程序中,给出了get_cid和get_list函数,函数都是利用requests库来向链接请求json数据,然后提取json数据当中的关键信息。
值得注意的是,上述的第11行程序中,构造的请求链接,有“qn”参数。其中,80表示的是1080高清。数值与清晰度的对应关系,如下表所示。
02.结果展示
程序讲解完毕后,接下来我们就看一下抓取的结果吧。
上图展示的是抓取视频的封面,可以看到,几乎每张封面都是小姐姐的舞蹈动作。下面菜鸟哥为大家展示一个小姐姐的舞蹈视频。
总结:
以上就是菜鸟哥今天为大家带来的福利内容,希望大家在学习程序的同时,能够下载自己喜欢的B站小姐姐舞蹈视频。
其实Python功能还是很强大,爬虫,数据分析,机器学习,自动化测试,运维,web网站后端开发样样都可以做,真的是非常一门值得学习的语言。有兴趣的同学可以操练起来,欢迎大家在下方留言吱一声,记得给个三连哦!
我是菜鸟哥,我们下期文章不见不散。
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com