php网页采集教程交流(PHP实现的抓取小说网站内容功能示例)
类别:编程学习 浏览量:1802
时间:2022-01-21 00:11:52 php网页采集教程交流
PHP实现的抓取小说网站内容功能示例本文实例讲述了PHP实现的抓取小说网站内容功能。分享给大家供大家参考,具体如下:
爬取免费内容,弄到手机,听书,妥妥的。
|
ini_set ( 'user_agent' , 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; GreenBrowser)' ); ini_set ( 'max_execution_time' , '0' ); $base = 'https://www.qu.la/book/19434/' ; $start = '7504808.html' ; $content_grep = '/ (.*)<br\/>/' ; //$content_grep = '/<li id="content">(.*)<br\/>/sS'; $next_grep = '/<a id="pager_next" href=\"(\d+\.html)\" target="_top" class="next">下一章<\/a>/' ; $next = $start ; $file_name = '听书了.txt' ; while ( $next ) { echo 'getting ' . $next . PHP_EOL; $result = file_get_contents ( $base . $next ); preg_match_all( $content_grep , $result , $match ); $isTitle = true; $content = "" ; foreach ( $match [1] as $line ) { $line = str_replace ( "<br/>" , '' , $line ); $line = str_replace ( " " , '' , $line ); if ( $isTitle ) { $content = $line . PHP_EOL . PHP_EOL; $isTitle = false; } else { $content .= ' ' . $line . PHP_EOL . PHP_EOL; } } $file = fopen ( $file_name , 'a' ); echo 'write length: ' . strlen ( $content ) . PHP_EOL; fwrite( $file , $content ); fclose( $file ); echo '.' ; preg_match( $next_grep , $result , $match ); $next = $match [1]; } |
希望本文所述对大家PHP程序设计有所帮助。
原文链接:https://blog.csdn.net/Alen_xiaoxin/article/details/79567579
您可能感兴趣
- phpmysql网站开发入门与提高(PHP+MySQL+sphinx+scws实现全文检索功能详解)
- phpinclude的使用方法(PHP defined函数的使用图文详解)
- 在php中与数据库连接的技术(PHP7.0连接DB操作实例分析基于mysqli)
- php怎么判断数据是质数(PHP判断一个变量是否为整数、正整数的方法示例)
- php 十六进制转换为二进制(PHP实现的62进制转10进制,10进制转62进制函数示例)
- php全栈之路教程(PHP进阶学习之依赖注入与Ioc容器详解)
- php中怎么判断变量类型(PHP INT类型在内存中占字节详解)
- phpmysql怎么搭建(PHP使用PDO、mysqli扩展实现与数据库交互操作详解)
- php类的属性和方法(PHP进阶学习之反射基本概念与用法分析)
- php获取数组中和为指定数的数组(php统计数组不同元素的个数的实例方法)
- thinkphp5.1 执行流程(Thinkphp5.0 框架的请求方式与响应方式分析)
- phpstudy 目录浏览宽度(JspStudy如何设置PHP根目录可编辑)
- php去水印方法(PHP开发的文字水印,缩略图,图片水印实现类与用法示例)
- phpredis消息队列(PHP+redis实现微博的推模型案例分析)
- php环境搭建apache(apache 支持 php5 的配置方法)
- thinkphp支付宝支付(thinkPHP和onethink微信支付插件分享)
- 寒假旅游攻略(成都寒假旅游攻略)
- 菲律宾旅游攻略(菲律宾旅游攻略地图)
- 清华大学难考吗(清华大学考研录取分数线)
- 观花盆栽佛肚竹盆景制作及养护(观花盆栽佛肚竹盆景制作及养护)
- 春天养佛肚竹,做好这几件事,叶绿根壮寓意好 越养越旺家(春天养佛肚竹做好这几件事)
- 律界衣品最好,时尚圈学识数高,41岁的Amal堪称现实版的傲骨贤妻(时尚圈学识数高)
热门推荐
- 前端webpack方面的优化(webpack的移动端适配方案小结)
- ReturnUrl带多个参数,返回时只返回一个参数的解决方法
- javascript构造重复数组(JavaScript平铺数组转树形结构的实现示例)
- django自定义后台界面(Django csrf 两种方法设置form的实例)
- php的字符串表达方法(php中字符串和整数比较的操作方法)
- numpy如何获取索引(NumPy 基本切片和索引的具体使用方法)
- python pdf文件操作(Python常见读写文件操作实例总结文本、json、csv、pdf等)
- wampserver命令行进不去(Win10无法启动wampserver怎么办)
- css3弹性盒模型常用属性(CSS3弹性盒模型开发笔记三)
- dedecms搜索功能的实现(DEDECMS调用特定ID文章内容的实现方法)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9