WordPress网站的robots文件代码怎样写比较好

news/2024/11/23 10:15:21/

本文记载和介绍的是wordpress的robots.txt的在哪儿?以及如何修改robots文件来禁止搜索引擎爬取/ajax目录下的文章。以及如何优化WordPress网站的robots文件

wordpress设置robots文件的目录:/wp-includes/functions.php,然后搜索do_robotstxt,大概在1699行。

在functions.php中,wordpress默认设置的robots文件是:

$output = "User-agent: *\n";$public = get_option( 'blog_public' );$site_url = parse_url( site_url() );$path     = ( ! empty( $site_url['path'] ) ) ? $site_url['path'] : '';
$output  .= "Disallow: $path/wp-admin/\n";
$output  .= "Allow: $path/wp-admin/admin-ajax.php\n";
  • 第一个output变量是允许所有的蜘蛛爬取页面,
  • 第二个output变量是禁止爬取/wp-admin/目录下的所有文件,
  • 第三个则是允许爬取/wp-admin/admin-ajax.php文件。

如果需要修改wordpress默认的robots禁止蜘蛛爬取某一个文件目录,这个时候直接再写入一个output变量,后面再写入需要禁止的目录名称即可。我需要禁止ajax目录,直接写入一个output变量,禁止爬取ajax目录就OK了。

关于wordpress的robots.txt文件在哪儿?wordpress修改robots文件的方法一文就记载到这,后续将观察禁止蜘蛛爬取ajax目录后,百度会不会继续收录此类目录下的页面。

下面小编整理的一些WordPress网站的robots.txt内容参考:

User-Agent: * (*星号,表示允许所以的搜索引擎蜘蛛)

Disallow: /wp-admin/ (disallow 表示不允许,不允许爬取/wp-admin/核心文件目录)

Disallow: /wp-includes/ (不允许爬取/wp-includes/核心文件目录)

Disallow: /wp-content/plugins (不允许爬取wordpress插件目录)

Disallow: /wp-content/themes (不允许爬取wordpress主题目录)

Disallow: /plus/ad_js.php (不允许爬取这个PHP文件)

Disallow: /plus/posttocar.php

Disallow: /anli/weixin (其它目录)

Disallow: /themes

Disallow: /get_activation

Disallow: /*?* (不允许蜘蛛爬取URL中带问号的链接)

Disallow: /*&* (不允许蜘蛛爬取URL中带&的链接)

Disallow: /*.rar (不允许蜘蛛爬取rar后缀的文件)

Disallow: /*.zip (不允许蜘蛛爬取zip后缀的压缩文件)

Sitemap: http : //xxx . com/sitemap.html (允许蜘蛛爬取网站静态地图)

Sitemap: http : //xxx . com/sitemap.xml (允许蜘蛛爬取sitemap网站地图)

robots.txt代码的规则还是非常简单的,就那么几个关键词:

User-Agent(搜索引擎蜘蛛名)、

Disallow(不允许)、

Allow(允许)、

Sitemap(指定网站的地图文件)。

如果我们只想让百度蜘蛛爬取我们的wordpress网站,而不让其它的搜索引擎蜘蛛进我的网站爬取,我们可以把上面代码中的User-Agent:* 修改成 User-Agent:baiduspider

另外,“Disallow: /wp-admin/” 与 “Disallow: /wp-admin”也表示不同的意思,虽然后面的只少了一个斜杠。“Disallow: /wp-admin/”表示禁止搜索引擎蜘蛛爬取网站wp-admin目录下的目录,但include目录中的文件仍然可以爬取;而“Disallow: /wp-admin”表示禁止搜索引擎蜘蛛爬取网站wp-admin整个目录,包括其下的所有文件。

如果想禁止搜索引擎蜘蛛爬取全站,可以用 Disallow: / ;

如果想允许搜索引擎蜘蛛可以爬取全站,可以用Allow:/;

如果想禁止搜索引擎蜘蛛爬取wordpress网站的全部PHP文件,可以用Disallow: /*.php 。

以上就是我们今天介绍的所有内容——如何为我们的wordpress网站添加robots.txt文件?每一个wordpress网站,可能的限制不一样,所以,我们都要根据自己网站情况,做出相应的修改,以达到最佳效果。注意:Disallow: /可千万要小心用哦,除非在我们wordpress网站的建站初期——网站还在建设当中,不希望搜索引擎来打扰。但一定要记住,等网站做好了,一定要去掉这个Disallow: / 。


http://www.ppmy.cn/news/547083.html

相关文章

Java ResultSet案例讲解

ResultSet ResultSet是我们使用jdbc连接时,查询的一个返回结果集,ResultSet resultSet stmt.executeQuery(sql),下面就使用例子介绍ResultSet的使用 例子是通过jdbc连接查account表中的数据,然后用实体类Account封装起来,返回这个类的集合。…

安装 centos 7.x 自定义分区

在安装系统的界面中,选择“INSTALLATION DESTINATION”,进入到系统的分区界面 选择下方选项框“i will configure partitioning”,选择完成后点击“Done” 选择如何分区硬盘的方式“Standard Partition”,并点击下方“”符号创建自定义磁…

kafka的分区详解

kafka的分区 副本机制分区Leader选举☆分区重新分配☆创建集群和主题查看主题详情再添加一个分区再添加一个节点重新分配修改副本因子 分区策略RangeAssignor分配策略RoundRobinAssignor分配策略StickyAssignor自定义分配策略 主要内容 : kafka分区的管理 ; 分区重新分配 Kafka…

Mysql分区大全及讲解

1.查看Mysql是否支持分区 show variables like ‘%partition%’; show plugins; 2.基于InnerDB创建分区表 create table tab_name(->id int not null->name varchar(30)->)engineInnoDB->partition by hash(id)->partitions 5;3.分区的优势 a.存储更多的数据 b…

MySql创建分区

Python微信订餐小程序课程视频 https://blog.csdn.net/m0_56069948/article/details/122285951 Python实战量化交易理财系统 https://blog.csdn.net/m0_56069948/article/details/122285941 一、Mysql分区类型 1、RANGE 分区:基于属于一个给定连续区间的列值&a…

MySQL分区表详解

通常情况下,同一张表的数据在物理层面都是存放在一起的。随着业务增长,当同一张表的数据量过大时,会带来管理上的不便。而分区特性可以将一张表从物理层面根据一定的规则将数据划分为多个分区,多个分区可以单独管理,甚…

Linux存储管理磁盘分区逻辑分区

目录 前言 一、逻辑分区 1、简介 2、演示创建四个主分区后的效果 1)创建四个分区(具体步骤见上一篇文章) 2)尝试创建第五个分区 3)删除第四个主分区,将其分为扩展分区 4)创建逻辑分区 3…

linux磁盘分区

文章目录 一 磁盘基础1.1 MBR与磁盘分区表示1.2 磁盘分区结构 二 管理磁盘及分区2.1 全局唯一标识分区表(GPT:GUID Partition Table)2.2 操作步骤2.3 检测并确认新硬盘fdisk2.3.1 字段含义2.3.2 交互模式常用命令2.3.3 创建分区步骤 2.4 创建…