乱一色一一区二区三区-露脸国产精品自产在线播-陆贞传奇第58集在线观看-鲁一鲁噜噜噜-鲁大师成人精品视频-噜噜在线

虛擬主機被搜索引擎爬蟲訪問耗費大量流量解決方法

日期:2016/8/3 / 人氣:

問題場景:客戶使用虛擬主機,網站被搜索引擎爬蟲訪問耗費大量流量和帶寬,如何處理

解決方法:可以通過在站點根目錄下創建Robots.txt,Robots.txt文件是網站的一個文件,搜索引擎蜘蛛抓取網站首先就是抓取這個文件,根據里面的內容來決定對網站文件訪問的范圍。它能夠保護我們的一些文件不暴露在搜索引擎之下,從而有效的控制蜘蛛的爬取路徑。

1、首先,先了解一下目前搜索引擎和其對應的User-Agent,如下:

搜索引擎         User-Agent
AltaVista        Scooter
baidu            Baiduspider
Infoseek         Infoseek
Hotbot           Slurp
AOL Search       Slurp
Excite           ArchitextSpider
Google           Googlebot
Goto             Slurp
Lycos            Lycos
MSN              Slurp
Netscape         Googlebot
NorthernLight    Gulliver
WebCrawler       ArchitextSpider
Iwon             Slurp
Fast             Fast
DirectHit        Grabber
Yahoo Web Pages  Googlebot
LooksmartWebPages Slurp
2、Robots.txt樣例代碼:

例1. 禁止所有搜索引擎訪問網站的任何部分
User-agent: *
Disallow: /
例2. 允許所有的搜索引擎訪問網站的任何部分
User-agent: *
Disallow:
例3. 僅禁止Baiduspider訪問您的網站
User-agent: Baiduspider
Disallow: /
例4. 僅允許Baiduspider訪問您的網站
User-agent: Baiduspider
Disallow:
例5. 禁止spider訪問特定目錄
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /data/
注意事項:1)三個目錄要分別寫。
2)請注意最后要帶斜杠。
3)帶斜杠與不帶斜杠的區別。
例6. 允許訪問特定目錄中的部分url
實現a目錄下只有b.htm允許訪問
User-agent: *
Allow: /a/b.htm
Disallow: /a/

 

作者:朋友圈科技


Go To Top 回頂部
主站蜘蛛池模板: 国产精品女同久久免费观看 | 无人知晓小说姜璟免费阅读 | 亚洲成av人在线视 | 国产成人福利免费视频 | 欧美特黄三级在线观看 | 91在线精品国产丝袜超清 | 天天做天天爽 | 狠狠色综合久久婷婷 | 2048论坛永久入口 原创合集 | 国产香蕉一区二区精品视频 | 日韩精品在线视频观看 | 边摸边吃奶边做爽gif动态图 | aaaa黄| 亚洲四虎| 欧美一区二区三区高清不卡tv | 亚洲欧美日韩久久一区 | 国产日韩欧美在线观看不卡 | 国产成人一区二区三区小说 | 美女班主任下面好爽好湿好紧 | 国产精品林美惠子在线观看 | 久久精品亚洲牛牛影视 | 国产精品日韩在线观看 | 免费国产之a视频 | 乌克兰粉嫩摘花第一次 | 亚洲精品国产精品麻豆99 | 国产成人精品曰本亚洲78 | 成年男女免费视频 | 美女脱一光二净的视频 | 亚洲精品视频免费在线观看 | 被夫上司侵犯了中文字幕 | 小兰被扒开内裤露出p | 色综合久久天天综合 | 精品国产原创在线观看视频 | 成人免费体验区福利云点播 | 日本免费一区二区三区a区 日本免费三片在线观看 | 久久AV国产麻豆HD真实乱 | 女教师雪白老汉 | 成人毛片1024你懂的 | 免费永久观看美女视频网站网址 | 日本中文字幕在线观看视频 | 国内自拍网红在线自拍综合 |