php网页采集教程交流(PHP实现的抓取小说网站内容功能示例)
类别:编程学习 浏览量:1802
时间:2022-01-21 00:11:52 php网页采集教程交流
PHP实现的抓取小说网站内容功能示例本文实例讲述了PHP实现的抓取小说网站内容功能。分享给大家供大家参考,具体如下:
爬取免费内容,弄到手机,听书,妥妥的。
|
ini_set ( 'user_agent' , 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; GreenBrowser)' ); ini_set ( 'max_execution_time' , '0' ); $base = 'https://www.qu.la/book/19434/' ; $start = '7504808.html' ; $content_grep = '/ (.*)<br\/>/' ; //$content_grep = '/<li id="content">(.*)<br\/>/sS'; $next_grep = '/<a id="pager_next" href=\"(\d+\.html)\" target="_top" class="next">下一章<\/a>/' ; $next = $start ; $file_name = '听书了.txt' ; while ( $next ) { echo 'getting ' . $next . PHP_EOL; $result = file_get_contents ( $base . $next ); preg_match_all( $content_grep , $result , $match ); $isTitle = true; $content = "" ; foreach ( $match [1] as $line ) { $line = str_replace ( "<br/>" , '' , $line ); $line = str_replace ( " " , '' , $line ); if ( $isTitle ) { $content = $line . PHP_EOL . PHP_EOL; $isTitle = false; } else { $content .= ' ' . $line . PHP_EOL . PHP_EOL; } } $file = fopen ( $file_name , 'a' ); echo 'write length: ' . strlen ( $content ) . PHP_EOL; fwrite( $file , $content ); fclose( $file ); echo '.' ; preg_match( $next_grep , $result , $match ); $next = $match [1]; } |
希望本文所述对大家PHP程序设计有所帮助。
原文链接:https://blog.csdn.net/Alen_xiaoxin/article/details/79567579
您可能感兴趣
- 自己在做项目过程中的php知识(PHP+Oracle本地开发环境搭建方法详解)
- 如何安装phpmysql环境(phpnow重新安装mysql数据库的方法)
- phpstudy数据库搭建教程交流(phpStudy V8如何修改数据库root密码)
- thinkphp静态怎么设置(浅谈thinkphp的nginx配置,以及重写隐藏index.php入口文件方法)
- php常用加密技术(php用户名的密码加密更安全的方法)
- phpstorm代码模板(phpStorm+XDebug+chrome 配置详解)
- php中变量定义规则(PHP中__set实例用法和基础讲解)
- php多维数组怎么转换json(php实现的数组转xml案例分析)
- thinkphp5如何实现消息队列(thinkPHP5.1框架使用SemanticUI实现分页功能示例)
- php哪个函数具有字符串截取功能(php字符串截取函数mb_substr用法实例分析)
- phpstudy使用教程最新版(phpstudy安装使用图文教程)
- 织梦cms中的模块怎么设置(织梦CMS模板在runphp=yes的标签中调用其他field值的方法)
- phpstudy安装步骤(phpStudy学习之php探针)
- php 静态方法(PHP的静态方法与普通方法用法实例分析)
- php nginx 底层执行流程(nginx/apache/php隐藏http头部版本信息的实现方法)
- phpstudyv8.0部署多站点(phpstudy v8.1 全站301重定向设置教程)
- 记忆中的台词(记忆中的台词)
- 袁冰妍轧戏 拍《琉璃》的同时还在拍《将夜》,难怪被骂演技差(拍琉璃的同时还在拍将夜)
- 刚红就耍大牌,《琉璃》角色滤镜碎一地,心疼工作人员(琉璃角色滤镜碎一地)
- 袁冰妍郑业成这对可以处,有脸红情话他们是真的敢说(袁冰妍郑业成这对可以处)
- 《祝卿好》台词又土又甜,就喜欢这么直接的恋爱(祝卿好台词又土又甜)
- 大女主 汤唯垂青电视圈,搭档朱亚文出演《大明皇妃孙若微传》(汤唯垂青电视圈)
热门推荐
- nginx配置详细讲解(Nginx服务快速入门教程)
- jquery解析xml
- python如何编写判断正负数程序(Python实现判断一个整数是否为回文数算法示例)
- mysql常用存储方案及基本原理(详解分析MySQL8.0的内存消耗)
- 如何布局网站的广告位
- ftp软件filezilla安装不了(filezilla连不上FTP服务器的解决方法)
- react usestate实现原理(浅谈react useEffect闭包的坑)
- h5 video支持格式(H5 video poster属性设置视频封面的方法)
- python3.5 tkinter教程(解决python3.5 正常安装 却不能直接使用Tkinter包的问题)
- php连接oracle(PHP远程连接oracle数据库操作实现方法图文详解)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9