快速保存网页所有内容（如何保存网页图文到单个文件）

滿裑騷菋 2023-03-01 01:37:10

网页可以非常方便的为我们展示各种信息，如果遇到重要的资料文献，希望在本地电脑上保存下来该怎么操作呢？把网址添加到收藏夹，下次直接打开网址查看，但如果资源被网站删除，就再也找不到了。还是保存在自己电脑里比较放心，那就使用浏览器的保存网页吧，如果保存为单个文件，则只有文字内容，图片丢失了。如果保存所有内容，将产生一个网页文件和一个资源文件夹，包括图片在内的文件都保存在这个文件夹中，由于文件较多不容易归类保存和传输。使用保存网页的方式，除正文外，还会保存网页标题导航栏、信息侧边栏、底部联系信息等无用的内容。

快速保存网页所有内容（如何保存网页图文到单个文件）(1)

需要保存的网页标题和正文

有没有一种方法，保存网页时，自动智能识别内容标题和正文，且仅保存标题和包括图片在内的正文内容，自动删除网页无效的头尾和侧边内容，更要过滤网页上的广告。这就是“AI保存网页“，如下图所示，打开任意新闻、公告或文章页面，再点击”AI保存网页“，就可以一键保存网页标题和正文。

快速保存网页所有内容（如何保存网页图文到单个文件）(2)

网页保存后与原页面对比

找到文档保存路径，可以看到以文章标题命名的网页文件。这个文档比较大，是因为同时保存和正文中的图片，也就是说把文字和图片都保存在单个文档中的。且为htm网页格式，可以使用任意浏览器打开。把图片保存在htm网页代码中，是什么原理呢？原来木头浏览器在保存网页时，自动把网页上的图片转换成Base64编码，这样就可以在单个文件中保存图片了。

快速保存网页所有内容（如何保存网页图文到单个文件）(3)

图片和文字内容保存在一个网页文件中

那么是怎样智能识别文章标题和正文的呢？有js基础的小伙伴可以继续往下看。

首先在项目管理器中，创建一个脚本代码步骤，通过执行一段js脚本代码找出文章标题。首先获取网页头部的title标签作为标题，其次是查找H1元素内容作为标题，如果还是找不到，则查找样式为title的元素内容作为标题。

快速保存网页所有内容（如何保存网页图文到单个文件）(4)

智能识别网页标题

var title=""; try{ title=document.title;//取网页标题 }catch{} if(title==""){ //网页标题为空时，查找H1元素内容作为标题 var h1s=document.getElementsByTagName("h1"); if(h1s.length>0) { title=h1s[0].innerText; } } if(title==""){ //仍未找到标题时，查找样式为title的元素内容作为标题 var h1s=document.getElementsByClassName("title"); if(h1s.length>0) { title=h1s[0].innerText; } } title;

再创建一个脚本代码步骤，定义几个重复使用的函数。

快速保存网页所有内容（如何保存网页图文到单个文件）(5)

同样使用js代码智能识别查找正文元素，一般文章正文部分由多个段落组成，所以我们从P元素入手，找到子元素包含大量P元素的元素，就是正文元素了。如果没有P元素，则获取页面中间位置，面积较大的元素作为正文元素，并给正文元素设置一个id值”mutoubrowser"作为标记。方便后续步骤调用。

快速保存网页所有内容（如何保存网页图文到单个文件）(6)

智能识别网页正文

再创建一个保存内容步骤，勾选“保存网页内容”，选择“下载图文单个文件”。设置文件名为js变量title，即标题做为文件名，并指定保存文件路径为“D:\文档”。在窗口下方设置正文的元素，通过js代码获得。

快速保存网页所有内容（如何保存网页图文到单个文件）(7)

保存图文到文件

document.getElementById("mutoubrowser");

最后保存项目文件为“AI保存网页”，通过点击书签按钮运行这个项目，就能智能识别网页标题和正文，保存网页有效内容和图片了。

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

秒懂生活

快速保存网页所有内容（如何保存网页图文到单个文件）

猜您喜欢

完美世界手游官网帮派（游戏攻略完美世界手游的帮派系统详情）

元青花民窑与官窑的纹饰区别（鸡太美和青花瓷数据战的背后）

如何让老年人快速使用智能手机（老年朋友使用智能手机）

外源因子安全性评估（抗Xa因子监测的临床应用）

深圳k系列螺旋锥齿轮减速机（K系列锥齿轮减速机的型号信息）

字节跳动风投部门（曾获字节跳动投资）

团购背后的商业逻辑（我调查了6家消费测评的商业背景）

热门推荐

排行榜