收藏我们

简体中文

  • 简体中文
  • 繁體中文
  • English
    帮助中心
    首页 - 帮助中心 - robots.txt注意事项有哪些?

    robots.txt注意事项有哪些?

    更新时间:2022-08-01 15:57:17


    robots.txt概念

    如果我们网站内有某些特殊的文件不让搜索引擎收录,那怎么办?

    答案是:使用一个叫做robots.txt的文件。

    robots.txt文件告诉搜索引擎本网站哪些文件是允许搜索引擎蜘蛛抓取,哪些不允许抓取。

    搜索引擎蜘蛛访问网站任何文件之前,需先访问robots.txt文件,然后抓取robots.txt文件允许的路径,跳过其禁止的路径。

    总结:robots.txt是一个简单的.txt文件,用以告诉搜索引擎哪些网页可以收录,哪些不允许收录。


    关于robots.txt文件的10条注意事项:

    1、如果未创建robots.txt文件,则代表默认网站所有文件向所有搜索引擎开放爬取。

    2、必须命名为:robots.txt,都是小写,robot后面加"s"。

    3、robots.txt必须放置在一个站点的根目录下。

    4、一般情况下,robots.txt里只写着两个函数:User-agent和 Disallow。

    5、空格换行等不能弄错,可复制这个页面并修改为自己的。

    6、有几个禁止,就得有几个Disallow函数,并分行描述。

    7、至少要有一个Disallow函数,如果都允许收录,则写: Disallow: 

        如果都不允许收录,则写:Disallow: /  (注:只是差一个斜杆)。

    8、允许有多个User-agent,如果对所有爬取蜘蛛生效,则用“*”星号表示。

    9、robtos.txt文件内可以放上Sitemap文件地址,方便告诉搜索引擎Sitemap文件地址。

    10、网站运营过程中,可以根据情况对robots.txt文件进行更新,屏蔽一些不要搜索引擎抓取的文件地址。

    增值电信业务经营许可证:苏B2-20170066 在线数据处理与交易许可证:苏B2-20170066苏公网安备 32010502010137号

    Copyright © 2016-现在 中介网 zhongjie.com All rights reserved 南京众杰网络科技有限公司 版权所有 苏ICP备16043105号-1

    025-822-26665