登陆 注册
您的位置:
莫非网 -> 站长宝典 -> Yahoo优化 -> 宝典内容

Yahoo!的新爬虫 : Slurp

[ 作者:佚名  来源:不详  发布时间:2006-10-28 5:17:35  收藏此页到站长网摘]
  最近,Yahoo!宣布其新的网站爬虫已投入使用,根据David Simpson在Yahoo Search Blog上的说明,该新爬虫仍然沿用Yahoo!爬虫的传统名称,Slurp,但索引速度更快更有效率,与它的前辈相比,它大约可节省25%的访问请求和带宽占用。

  Yahoo!爬虫的效率对我们来说一直是个困扰,以IT技术点评6月份的情况为例,“Yahoo Slurp的读取数据量为170.31M,与之相对的是Googlebot的57.48M和BaiduSpider 39.26M,明显的投入产出比较差,有点可笑的是,6月Yahoo Slurp读取Robots.txt的次数为3104,平均每天100次,不知道是不是因为Yahoo Slurp从不记录Robots.txt的内容,每读取一次网页就要查看一下Robots.txt。”老实说,究竟为什么Yahoo!的效率低到这个程度我们也无从知晓,也许,是Yahoo!与Yahoo!中文造成的重复访问?(纯属猜测)

  Anyway,希望新的索引爬虫的上线能够让这种情况多多少少得到些改善,不然,真的要考虑是不是干脆在robots.txt中禁掉了Yahoo! Slurp了。

Yahoo! Slurp的介绍
  从Yahoo!对其的介绍看,应该还是值得期待的。——虽然目前从我们的Web服务器日志上仍看不出有什么改变。

In addition to crawling the Internet faster, our new crawler is more efficient at visiting websites. As a result, site owners will notice as much as a 25% reduction in the number of requests and bandwidth consumed by the crawler.

Now, with the new crawler in full production, we have turned off the old crawler and site owners should see a much lower crawl load without a loss in content coverage.

  同时,Yahoo!还对前段时间引人诟病的Yahoo!爬虫“疯狂”的访问提出解释:

While transitioning to the new crawler over the past few weeks, we had been running both crawlers in tandem. In some cases, this increased the frequency of Yahoo Search requests to websites. Now, with the new crawler in full production, we have turned off the old crawler and site owners should see a much lower crawl load without a loss in content coverage.

With this change of behavior in the crawler, you may see some shuffling of the pages that are included in the index and some changes in ranking as well.

 

责任编辑:莫非
】 【打印】 【关闭
图片报道
Yahoo!的新爬虫 : Slurp评论(评论只代表网友观点)
[查看评论]
用户名
分 值 100分 85分 70分 55分 40分 25分 10分 0分
说 明
  (注“”为必填内容。)
·用户发表意见仅代表其个人意见,并且承担一切因发表内容引起的纠纷和责任
·请客观的评价您所看到的资讯,提倡就事论事,杜绝漫骂和人身攻击等不文明行为
·本站内容均来自网络如果有版权和利益的纷争请及时联系我们,联系电话:010-51724886
·为了丰富本真内容如果有好的原创想在莫非网刊出请投稿,投稿信箱:post@mofei.com.cn

内容搜索

热门宝典

最新宝典

推荐宝典