Yahoo!爬虫的效率对我们来说一直是个困扰,以IT技术点评6月份的情况为例,“Yahoo Slurp的读取数据量为170.31M,与之相对的是Googlebot的57.48M和BaiduSpider 39.26M,明显的投入产出比较差,有点可笑的是,6月Yahoo Slurp读取Robots.txt的次数为3104,平均每天100次,不知道是不是因为Yahoo Slurp从不记录Robots.txt的内容,每读取一次网页就要查看一下Robots.txt。”老实说,究竟为什么Yahoo!的效率低到这个程度我们也无从知晓,也许,是Yahoo!与Yahoo!中文造成的重复访问?(纯属猜测)
Anyway,希望新的索引爬虫的上线能够让这种情况多多少少得到些改善,不然,真的要考虑是不是干脆在robots.txt中禁掉了Yahoo! Slurp了。
Yahoo! Slurp的介绍
从Yahoo!对其的介绍看,应该还是值得期待的。——虽然目前从我们的Web服务器日志上仍看不出有什么改变。
In addition to crawling the Internet faster, our new crawler is more efficient at visiting websites. As a result, site owners will notice as much as a 25% reduction in the number of requests and bandwidth consumed by the crawler.
Now, with the new crawler in full production, we have turned off the old crawler and site owners should see a much lower crawl load without a loss in content coverage.
同时,Yahoo!还对前段时间引人诟病的Yahoo!爬虫“疯狂”的访问提出解释:
While transitioning to the new crawler over the past few weeks, we had been running both crawlers in tandem. In some cases, this increased the frequency of Yahoo Search requests to websites. Now, with the new crawler in full production, we have turned off the old crawler and site owners should see a much lower crawl load without a loss in content coverage.
With this change of behavior in the crawler, you may see some shuffling of the pages that are included in the index and some changes in ranking as well.
| · 100个优秀web2.0网站点评(附网址) | |
| · 花十二个月建立一个成功的网站 | |
| · 如何用IIS建立高安全性Web服务器 | |
| · 玩转战略推广,让网站一夜成名 | |
| · Google的高级搜索技巧 | |
| · 考研加油站(kaoyan.com)站长小林访谈 | |
| · 通向赢利的路不止广告一条 | |
| · 提高网站及服务器效率的优化方案 | |
| · 你是否了解?谈虚拟主机的控制面板 | |
| · 百度不为人知的网页搜索技巧实战 |
| · 2008新版SEO方程式 | |
| · 有了好域名才有好的竞争力 | |
| · 巧妙利用错别字做文章吸收流量 | |
| · 互联网企业生于创新 死于安逸 | |
| · 门户类站之新栏目赢利方法:站长信贷模 | |
| · 百奥谷搜索引擎优化大赛一本万利的好模 | |
| · 使你的网站被三大搜索引擎快速收录 | |
| · 全面解析百度降权问题 | |
| · 其实菜鸟也能建好网站 | |
| · 2008年站长的目标在哪里? |
| · SEO中新域名被快速收录的六种方法 | |
| · 让网站流量稳步飙升的秘籍 | |
| · 天下知营销网-关键词优化.案例分析!! | |
| · 内容运营问题:广告当作内容运营 | |
| · 如何让百度新算法快速收录网站 | |
| · 网站SEO如何应对百度新算法而被快速收 | |
| · 友情链接中的伎俩 | |
| · Adsense优化篇之第一广告单元价最高 | |
| · 虚拟主机如何实现泛域名解析? | |
| · 关于搜索引擎中网络爬虫的设计分析 |