据说是个人写的蜘蛛程序,指向的是 http://www.yunyun.com/spider.html,yunyun.com 目前不能访问,建议屏蔽之。
不过对于国内网站来说不会带来什么流量,可以选择robots.txt协议禁止。
User-agent: YYSpider
Disallow: /
如果还是禁止不了,可以选择nginx规则禁止访问,如下:
if ($http_user_agent ~* "YYSpider") {
return 403;
}
WellKnown蜘蛛
华为蜘蛛
人工智能模型爬虫
Criteo蜘蛛
网页爬虫
宜搜蜘蛛
exa蜘蛛
Grapeshot蜘蛛
hubspot蜘蛛
微软学术蜘蛛
MegaIndex蜘蛛
Ask蜘蛛