阿里云虚拟主机带公网地址吗(阿里云虚拟主机被搜索引擎爬虫访问耗费大量流量解决方法)
阿里云虚拟主机带公网地址吗
阿里云虚拟主机被搜索引擎爬虫访问耗费大量流量解决方法问题场景:
客户使用虚拟主机,网站被搜索引擎爬虫访问耗费大量流量和带宽,如何处理。
解决方法:
可以通过在站点根目录下创建 Robots.txt,Robots.txt 文件是网站的一个文件,搜索引擎蜘蛛抓取网站首先就是抓取这个文件,根据里面的内容来决定对网站文件访问的范围。它能够保护我们的一些文件不暴露在搜索引擎之下,从而有效的控制蜘蛛的爬取路径。
注:Robot.txt协议不是强制协议,部分搜索引擎或者伪装成搜索引擎的爬虫不会遵守该协议,对于不遵守该协议的情况,以下方法无效。
1. 首先,先了解一下目前搜索引擎和其对应的 User-Agent,如下:
搜索引擎 User-Agent
AltaVista Scooter
baidu Baiduspider
Infoseek Infoseek
Hotbot Slurp
AOL Search Slurp
Excite ArchitextSpider
Google Googlebot
Goto Slurp
Lycos Lycos
MSN Slurp
Netscape Googlebot
NorthernLight Gulliver
WebCrawler ArchitextSpider
Iwon Slurp
Fast Fast
DirectHit Grabber
Yahoo Web Pages Googlebot
LooksmartWebPages Slurp
2. Robots.tx t样例代码:
例1. 禁止所有搜索引擎访问网站的任何部分
User-agent:
Disallow: /
例2. 允许所有的搜索引擎访问网站的任何部分
User-agent:
Disallow:
例3. 仅禁止Baiduspider访问您的网站
User-agent: Baiduspider
Disallow: /
例4. 仅允许Baiduspider访问您的网站
User-agent: Baiduspider
Disallow:
例5. 禁止spider访问特定目录
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /data/
注意事项:
三个目录要分别写。
请注意最后要带斜杠。
带斜杠与不带斜杠的区别。
例6. 允许访问特定目录中的部分url
实现a目录下只有b.htm允许访问
User-agent: *
Allow: /a/b.htm
Disallow: /a/
- 配置阿里云docker镜像地址(Docker配置阿里云镜像加速pull的实现)
- 阿里云docker 基础镜像(Docker 配置阿里云容器服务操作)
- 阿里云服务器怎么登录查看代码(如何登陆阿里云服务器,阿里云服务器怎么登陆)
- 两个阿里云账号服务器内网通信(阿里云服务器怎么与租用香港服务器组内网?)
- 阿里云ecs集群怎么设置(阿里云ECS服务器如何监控资源使用情况)
- 阿里云对象存储oss请求次数(阿里云服务器本地上传到OSS对象存储节点)
- nginx https 域名配置(阿里云Nginx配置https实现域名访问项目图文教程)
- 如何把阿里云盘加入到快捷操作(阿里云如何挂载数据盘?阿里云挂载数据盘一键脚本)
- 阿里云服务器攻击了怎么办(云服务器被攻击了补救措施)
- 阿里云服务器购买时考虑的因素(购买阿里云服务器后的基本安全配置)
- 阿里云服务器实例用户名(阿里云服务器新建用户具体方法)
- mysql 安装阿里云(详解如何在阿里云服务器安装Mysql数据库)
- docker添加mq基础镜像(Docker阿里云RocketMQ 4.5.1部署流程详解)
- 如何用阿里云绑定域名(阿里云域名和ip绑定步骤方法实现)
- 阿里云服务器更改登录密码(阿里云服务器怎么修改登录密码?)
- 阿里云注册域名ddns怎么写(如何通过阿里云实现动态域名解析DDNS的方法)
- 七夕取消是什么梗(七夕取消是什么梗)
- 这竟然是捏出来的 20种橡皮泥玩法让你轻松hold住魔娃(这竟然是捏出来的)
- 自制橡皮泥(自制橡皮泥)
- 还在卖 禁药西布曲明网上论斤卖(还在卖禁药西布曲明网上论斤卖)
- 微商在朋友圈热卖的 DL减肥咖啡 含违禁药物,你还敢买吗(微商在朋友圈热卖的)
- 八一节,说说中国女兵(八一节说说中国女兵)
热门推荐
- js宏任务都有哪些(JavaScript 操作宏任务与微任务)
- sqlserver技术文档(sql server2016里面的json功能浅析)
- _viewstart.cshtml的作用
- 宝塔waf防火墙怎么关闭(宝塔面板防火墙添加百度云加速IP段白名单)
- canvas怎么压缩图片(使用canvas压缩图片大小的方法示例)
- css高级使用技巧(全面解析CSS Media媒体查询使用操作推荐)
- jmeter接口性能测试教程(Xmeter API接口测试工具使用方法解析)
- 使用docker对集群进行管理(使用docker搭建kong集群操作)
- js的异步请求(浅谈JS三座大山之异步和单线程)
- dedecms栏目内容怎么插入分页符(dedecms织梦让likearticle的mytypeid支持多个栏目和子栏目)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9