UserAgent中的AhrefsBot解释 AhrefsBot爬虫是什么

发布时间:2022-05-19 11:15:31


51.222.253.7 - - [19/May/2022:03:51:24 +0800] "GET /gif/show/688.html HTTP/1.1" 200 227 "-" "Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)"

这是一个站点的爬虫记录,好奇这是哪个公司的。网上搜索了一下,是个国外营销公司的,勤奋程度据说仅次于谷歌了。真是把数据挖掘做到了极致。

官方网站的介绍总结就是一个对于我们国内用户无用的蜘蛛

什么是AhrefsBot?

AhrefsBot 是一个 Web 爬虫,为 Ahrefs 在线营销工具集的 12 万亿链接数据库提供支持。它不断抓取网络以使用新链接填充我们的数据库并检查以前找到的数据的状态,以便为我们的用户提供最全面和最新的数据。

来自网络的 Ahrefs Bot 收集的链接数据被全球数千名数字营销人员用于规划,执行和监控他们的在线营销活动。 这些数据对 SEO 社区具有巨大价值,因为它可以帮助营销专业人员更好地理解世界上最大的搜索引擎的基本算法,以便他们可以相应地优化网站。我们的爬虫每隔 24 小时访问超过 60 亿个网页,并每 15-30 分钟更新一次 Ahrefs 的索引。 根据最近一项关于“好机器人”的第三方研究,AhrefsBot 是仅次于 Googlebot 的第二大活跃爬虫。

AhrefsBot 在您的网站上做什么?

AhrefsBot 正在抓取您的网站,记录出站链接并将其添加到我们的数据库中。它会定期重新抓取您的网站以检查以前找到的链接的当前状态。

我们的抓取工具不会收集或存储有关您网站的任何其他信息。它不会在您的网站上触发广告(如果有),也不会为您的 Google Analytics(分析)流量增加数字。

它是否尊重 robots.txt 文件?

是的。绝对地。

我们严格尊重 robots.txt,禁止和允许规则。

作者/来源:NBQQ网
分类:互联网

站点信息来源网络。如有异议、侵权,请联系我们

NBQQ网 | 关于我们 | 冀ICP备12022228号-3