百度镜像网站的三种形式和处理方法

Auth:admin       Date:2019/08/4       Cat:SEO百科

为什么会有镜像网站这种事呢?镜像网站的内容和主网站的内容和目录层级能保持同步,但是域名却是镜像网站的。百度在收录时,发现两个相同的页面,这时它就会分析是否有作弊或者抄袭的情况,这样就会对被镜像的网站SEO非常不利。那么百度镜像网站是什么?如何处理这种情况呢?武汉SEO为具体分析一下。

一、什么是镜像网站

百度镜像网站是指,你打开某个网站时,对方的网站内容、目录层级,和你的网站保持同步。包含内链、内容、图片等,甚至能替换掉你网站的相对链接。

很多人对采集站和镜像站混淆,实际上二者有本质的区别。

1、采集站是抓取目标网站的内容,导入到自己网站的数据库,然后通过程序调用到自己网站上。内容无法实时同步,采集调用以后才会出现。

2、镜像网站不抓取内容,不导入数据库,有人访问时实时从被镜像的站点调取内容,然后自动处理(替换URL、文字、加JS处理等),然后实时显示。被镜像的网站有更新,镜像网站实时显示。

二、百度镜像网站的三种形式

1、内容镜像

镜像网站搭建了独立的网站,有自己的网站目录层级,它只是在某个目录或者某些目录镜像你网站的内容,这种方式非完全意义的镜像网站。

2、主体镜像

整站框架和内容都会调用目标网站的内容,站点的除域名外的每个元素都相同。

3、框架镜像

这种形式并非完全的百度镜像,它利用框架技术来实时镜像,并没有同步目标网站的内容,危害性不大。

三、百度镜像网站如何处理

1、百度站长平台投诉

百度站长后台提供了投诉的入口:

Jubao.baidu.com

Tousu.baidu.com

Zhanzhang.baidu.com/feedback

站长在站长平台说明实际的情况,最好能提供图文资料。

2、屏蔽百度镜像网站服务器IP

发现一个镜像网站,首先你要确定对方网站的IP,你可以通过百度统计代码、日志分析工具查询,如果你的网站用了CDN加速,你要找出对方网站的原始IP。如何屏蔽IP,可以咨询主机提供商或者通过服务器来屏蔽访问。

屏蔽镜像站点IP,打开.htaccess文件,加上如下代码

Linux下 规则文件.htaccess(没有可以手工创建.htaccess文件到站点根目录),自行修改红字中的IP地址

RewriteEngine On
#Block ip
RewriteCond %{http:X-Forwarded-For}&%{REMOTE_ADDR} (188.129.143.73) [NC]
RewriteRule (.*) - [F]

3、JS跳转

 在head区插入一下的JS:


定期的数据分析是SEOer的一项必须做的工作,它能让你及时发现网站的数据异常,及时处理网站被镜像的状况。以上是笔者的经验总结,观点仅供参考。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注