综合久久综合_国产视频久久_亚洲国产第一页_日本久久成人_欧美在线播放一区_欧美日韩国产在线观看

虛擬主機被搜索引擎爬蟲訪問耗費大量流量解決方法

日期:2016/8/3 / 人氣:

問題場景:客戶使用虛擬主機,網站被搜索引擎爬蟲訪問耗費大量流量和帶寬,如何處理

解決方法:可以通過在站點根目錄下創建Robots.txt,Robots.txt文件是網站的一個文件,搜索引擎蜘蛛抓取網站首先就是抓取這個文件,根據里面的內容來決定對網站文件訪問的范圍。它能夠保護我們的一些文件不暴露在搜索引擎之下,從而有效的控制蜘蛛的爬取路徑。

1、首先,先了解一下目前搜索引擎和其對應的User-Agent,如下:

搜索引擎         User-Agent
AltaVista        Scooter
baidu            Baiduspider
Infoseek         Infoseek
Hotbot           Slurp
AOL Search       Slurp
Excite           ArchitextSpider
Google           Googlebot
Goto             Slurp
Lycos            Lycos
MSN              Slurp
Netscape         Googlebot
NorthernLight    Gulliver
WebCrawler       ArchitextSpider
Iwon             Slurp
Fast             Fast
DirectHit        Grabber
Yahoo Web Pages  Googlebot
LooksmartWebPages Slurp
2、Robots.txt樣例代碼:

例1. 禁止所有搜索引擎訪問網站的任何部分
User-agent: *
Disallow: /
例2. 允許所有的搜索引擎訪問網站的任何部分
User-agent: *
Disallow:
例3. 僅禁止Baiduspider訪問您的網站
User-agent: Baiduspider
Disallow: /
例4. 僅允許Baiduspider訪問您的網站
User-agent: Baiduspider
Disallow:
例5. 禁止spider訪問特定目錄
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /data/
注意事項:1)三個目錄要分別寫。
2)請注意最后要帶斜杠。
3)帶斜杠與不帶斜杠的區別。
例6. 允許訪問特定目錄中的部分url
實現a目錄下只有b.htm允許訪問
User-agent: *
Allow: /a/b.htm
Disallow: /a/

 

作者:朋友圈科技


Go To Top 回頂部
主站蜘蛛池模板: 欧美精品黄色 | 久久精品小短片 | 久久国产精品99久久人人澡 | 亚洲国产精品久久久久 | 看片一区二区三区 | 国产精品99一区二区 | www.91sese| 精品一区二区三区在线观看视频 | 奇米影视亚洲精品一区 | 久久久久北条麻妃免费看 | 欧美日日操 | 精品国产一区二区三区免费 | 九九热免费视频在线观看 | 中文字幕视频在线播放 | 精品国产一区二区三区四区在线 | 久久久久国产成人免费精品免费 | 免费久久精品 | 日本a∨精品中文字幕在线 狠狠干精品视频 | 欧美成人se01短视频在线看 | 久久久日韩精品一区二区 | 毛片免费看网站 | 成人性生活视频 | 久草免费资源视频 | 法国性经典xxxhd| 亚洲一区二区不卡视频 | 欧美日韩后 | 羞羞视频免费观看入口 | 日韩av片在线免费观看 | 日韩欧美电影一区二区三区 | 在线a毛片 | 国产亚洲精品成人a | 91精品国产乱码久久久久久久久 | 久久精品视频一区二区三区 | 久久精品亚洲精品国产欧美kt∨ | 国产精品剧情一区二区三区 | 一区二区三区小视频 | 久久国产乱子伦精品 | 国产91porn| 99久久自偷自偷国产精品不卡 | 国产精品jk白丝蜜臀av软件 | 55夜色66夜色国产精品视频 |