主机测评 VPS推荐
专注于真实的VPS测评
ptgidc ptgidc ptgidc

如何理解linux中web服务器爬虫协议robot

ptgidc ptgidc

这期内容当中小编将会给大家带来有关如何理解linux中web服务器爬虫协议robot,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。 robots.txt常用配置内容总结:(提示直接放在web根目录下即可,可以使用百度站长工具robot工具测试
User-agent: Baiduspider
Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disall开发云主机域名ow: /*.png$
Disallow: /*.bmp$

User-agent: Googlebot
Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: 360Spider

Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: msnbot

Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: Sosospider

Allow: /
Disallow: /*.jpg$
Disallow: /*开发云主机域名.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: YoudaoBot

Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$
root@ubuntu:/var/www# cat robots.txt
User-agent: Baiduspider
Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: Googlebot
Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp开发云主机域名$

User-agent: 360Spider

Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: msnbot

Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: Sosospider

Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: YoudaoBot

Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: bingbot

Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: Sogou web spider/4.0
Allow: /
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

User-agent: *
Disallow: /
上述就是小编为大家分享的如何理解linux中web服务器爬虫协议robot了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注开发云行业资讯频道。

本文从转载,原作者保留一切权利,若侵权请联系删除。

《如何理解linux中web服务器爬虫协议robot》来自互联网同行内容,若有侵权,请联系我们删除!

未经允许不得转载:主机测评 » 如何理解linux中web服务器爬虫协议robot