Robots.txt入门使用方法指南

郝哥 • 2022年8月6日上午9:46 • 投稿

文章目录

1 什么是Robots.txt文件？2 Robots.txt用法2.1 写 robots 文件注意：2.2 常见各大搜索引擎蜘蛛名称：3 测试您的Robots.txt文件

Robots.txt文件能控制哪些搜索引擎可以爬您的网站，可以爬网站的哪些页面，或者哪些页面不能爬，Robots.txt是一个简单的文本文件，位于您网站的根目录中。正确使用Robots.txt，可以提高抓取频率，它也会间接影响您的SEO效果。

什么是Robots.txt文件？

robots.txt文件是一个协议，每个可靠的机器人必须遵循的协议。某些非法机器人（一些恶意爬虫）不遵守这项协议。

可以通过输入任何URL并在末尾添加：/robots.txt来查询任何网站的Robots.txt

Robots.txt用法

禁止所有搜索引擎访问网站的任何部分：

User-agent: *Disallow: /

允许所有搜索引擎蜘蛛访问（或者建一个空文件“robots.txt”）：

User-agent: *Allow: /

禁止某个搜索引擎访问(只是举例，千万不要禁止百度)：

User-agent: BaiduspiderDisallow: /

允许某个搜索引擎访问：

User-agent: BaiduspiderAllow: /

只允许某个搜索引擎访问，其他搜索引擎禁止访问：

User-agent: BaiduspiderDisallow:User-agent: *Disallow: /

只禁止某个搜索引擎访问，其他搜索引擎允许访问：

User-agent: BaiduspiderDisallow: /User-agent: *Disallow:

User-agent

User-agent 代表蜘蛛名称，例如：

User-agent: Baiduspider 代表针对百度蜘蛛。User-agent: * 代表所有的搜索引擎，*是一个通配符。

Disallow

Disallow 表示不允许，代表禁止蜘蛛爬取的文件或目录。例如：

Disallow: /admin/ 代表禁止爬取 admin 目录下的所有文件。Disallow: /cgi-bin/*.htm 代表禁止访问 /cgi-bin/ 目录下的所有以.htm为后缀的 URL（包含子目录）。Disallow: /? 代表禁止访问网站中所有包含问号?的网址。Disallow: /.jpg$ 代表禁止爬取网页所有的.jpg格式的图片。Disallow:/ad/ct.html 代表禁止爬取 ad 文件夹下的 ct.html 文件。

Allow

Allow 表示允许，代表允许蜘蛛爬取的目录或文件。例如：

Allow: /cgi-bin/ 代表允许爬取 cgi-bin 目录下的目录。Allow: /tmp 代表允许爬取 tmp 的整个目录。Allow: .htm$ 代表仅允许访问以.htm为后缀的 URL。Allow: .gif$ 允许爬取网页和 GIF 格式的图片。写 robots 文件注意：不要写绝对路径，就是不要带网站域名，用 / 代替即可。robots 文件中的所有符号都是在英文状态下写的。注意空格，例如 Disallow: /admin/ 中 : 后面紧跟着一个空格。注意大小写，例如 Disallow: /admin/ 中 Disallow 的D是大写的。常见各大搜索引擎蜘蛛名称：google 蜘蛛： Googlebot百度蜘蛛： Baiduspider360蜘蛛：360Spiderbing 蜘蛛：Bingbot搜狗蜘蛛：Sogou web spider有道蜘蛛 :YodaoBot头条蜘蛛：Bytespider测试您的Robots.txt文件

打开百度搜索资源平台 – 数据统计 – Robots – 检测并更新，在下面输入您的url，点击 – 校验，显示允许，说明robots.txt设置正确。

郝哥注册用户

0 0

最火的挂机赚钱软件推荐(可以挂机赚钱靠谱吗)

如果不用他们动手，那就更棒了。于是，全自动挂机赚钱工具，顺势而生。那今天犇犇就来为大家揭秘一下，挂机软件是如何把钱赚的。项目比较灰色，套路也比较多，所以犇犇在此仅做揭秘，不建议大…

小多多
杂谈 2021年12月13日
籍贯是什么意思（籍贯和老家有什么区别）

[ 扬帆导读 ] W频道——互联网最棒的知识付费频道！老家，是父母长期居住的地方，儿女或许从小在此地成长；或许是过年过节时能回去聚会的场所；或许仅仅是履历表中填写的一个陌生的地理位…

吉米
投稿 2022年3月24日
创业三要素是哪三要素(创业成功必备3要素)

谈到赚钱，就离不开创业。提到创业，我们就少不了一种担忧。那就是创业成功是一种小概率的事情。我们如何做才能成为小概率的一员？如何战胜内心的恐惧？香港一名著名企业家曾经说过：创业者创…

fox张
2021年11月20日 • 投稿
投稿

2020年大型网络游戏排行榜(游戏排行榜)

2020年大型网络游戏排行榜1. 原神《原神》是一款开放性世界的冒险游戏，由上海米哈游制作，于2020年9月开启测试。独特的二次元游戏画风，丰富饱满的背景故事与风格迥异角色设定让…

默默
2022年5月4日
台湾怎么分割出去的（台湾第一次分离的事件）

天下大势，“分久必合，合久必分”，此乃古今之公理也。祖国宝岛——台湾，和祖国大陆一海之隔，因为台湾海峡和大陆隔海相望。建国70年来，她一直和大陆武装对峙、处于分离状态。统一台湾，…

小多多
投稿 2022年1月25日
杂谈

300120股票价格经纬辉开300120股票今天多少钱

　　经纬辉开（300120）今日股票最新价6.860，涨跌额0.110，涨跌幅1.630%，最高6.870，最低6.730。　　经纬辉开（300120）股份流通受限总股本数值（万…

海淘直接
2022年6月22日
投稿

女生最好看的脸型排名，来看看你的脸型上榜没

比起脸上的皮肤问题，爱美的女生更无可奈何的是自己的脸型问题，脸上的皮肤还可以通过护肤变得好起来，但是更影响颜值的脸型即使是坚持按摩，也收效甚少。不是小编一个人觉得，女生的脸型也有好…

xswh
2022年3月31日
投稿

4k硬屏好还是软屏好（软屏贵还是硬屏贵）

液晶屏幕分为软屏和硬屏，但是这并不是字面意思，而是指液晶分子排列方式不同，软屏的液晶分子是垂直于屏幕的，硬屏的液晶分子排列是平行与屏幕的，因此软屏用手去按的时候会出现水波纹，而硬屏…

迅捷
2022年4月9日
魔兽世界部落怎么去秘蓝岛（wow猎人必抓的五只宠物）

[ 扬帆导读 ] 秘血岛位于秘蓝岛的北方，两个小岛通过一条狭长的桥梁相连接，它曾经跟秘蓝岛一样美丽，有个好听的名字叫做“银风岛”。只不过在德莱尼到来不久，这座美丽的小岛便被埃索达迫…

仰望辉煌。　　
2022年3月24日 • 投稿
好用的面膜排行榜前十名（十大顶级面膜排行榜）

源：托腮少女张橙子（文/张橙子）这段时间一直在家办公居多，时不时会一边码着稿一边敷着面膜，这种感觉真的好自在呀 ~ 工作心情能这么好，当然少不了我真爱面膜们的功劳，今天就是来好好…

小多多
2022年1月25日 • 投稿
钓鳊鱼用饵料还是玉米（玉米钓鳊鱼钓底还是钓浮）

玉米钓鳊鱼用玉米比较好。这种鱼一般在水体的中下层活动，钓底更容易上钩。通常要在水草多、水质干净的入水口处垂钓。抛竿之后最好让鱼竿一直处于活动的状态。当鱼漂出现顶漂、黑漂以及平移现…

小多多
杂谈 2021年12月13日
何不食肉糜是什么意思（何不食肉糜怎么回击）

西晋孝惠皇帝司马衷，字正度，晋武帝司马炎次子。衷通中，正中不偏之意。正度都是标准的意思。司马炎希望司马衷成为一个做事公正，按照套路办事的人。后世史书都说晋惠帝是个白痴，傻瓜，其实不…

迅捷
2022年4月9日 • 投稿
创业成功人士的案例(身边人白手起家的故事分享)

可能是我圈层的原因，他是我身边唯一一位同龄人，创业并取得成功的故事。

小多多
投稿 2021年11月20日
投稿

怎么样才能减肥呢(怎么坚持减肥)

#减肥什么方法最有效# 什么减肥方法最有效，你知道吗？减肥的人需要从生活细节入手，降低热量摄入，提高身体的热量输出，才能减掉身上赘肉。下面分享几个燃脂方法，让你提高身体的热量缺口…

xswh
2022年3月31日
sam解锁成就原理（sam开启条件）

SAM全称为SteamAchievementManager，是一款一键解锁steam成就的工具，能够方便快捷的解锁steam游戏成就。图文使用教程：先登录steam,然后打开S…

小多多
杂谈 2021年12月13日

Robots.txt入门使用方法指南

相关推荐