文章目录[隐藏]
为什么会有镜像网站这种事呢?镜像网站的内容和主网站的内容和目录层级能保持同步,但是域名却是镜像网站的。百度在收录时,发现两个相同的页面,这时它就会分析是否有作弊或者抄袭的情况,这样就会对被镜像的网站SEO非常不利。那么百度镜像网站是什么?如何处理这种情况呢?武汉SEO为具体分析一下。
一、什么是镜像网站
百度镜像网站是指,你打开某个网站时,对方的网站内容、目录层级,和你的网站保持同步。包含内链、内容、图片等,甚至能替换掉你网站的相对链接。
很多人对采集站和镜像站混淆,实际上二者有本质的区别。
1、采集站是抓取目标网站的内容,导入到自己网站的数据库,然后通过程序调用到自己网站上。内容无法实时同步,采集调用以后才会出现。
2、镜像网站不抓取内容,不导入数据库,有人访问时实时从被镜像的站点调取内容,然后自动处理(替换URL、文字、加JS处理等),然后实时显示。被镜像的网站有更新,镜像网站实时显示。
二、百度镜像网站的三种形式
1、内容镜像
镜像网站搭建了独立的网站,有自己的网站目录层级,它只是在某个目录或者某些目录镜像你网站的内容,这种方式非完全意义的镜像网站。
2、主体镜像
整站框架和内容都会调用目标网站的内容,站点的除域名外的每个元素都相同。
3、框架镜像
这种形式并非完全的百度镜像,它利用框架技术来实时镜像,并没有同步目标网站的内容,危害性不大。
三、百度镜像网站如何处理
1、百度站长平台投诉
百度站长后台提供了投诉的入口:
Jubao.baidu.com
Tousu.baidu.com
Zhanzhang.baidu.com/feedback
站长在站长平台说明实际的情况,最好能提供图文资料。
2、屏蔽百度镜像网站服务器IP
发现一个镜像网站,首先你要确定对方网站的IP,你可以通过百度统计代码、日志分析工具查询,如果你的网站用了CDN加速,你要找出对方网站的原始IP。如何屏蔽IP,可以咨询主机提供商或者通过服务器来屏蔽访问。
屏蔽镜像站点IP,打开.htaccess文件,加上如下代码
Linux下 规则文件.htaccess(没有可以手工创建.htaccess文件到站点根目录),自行修改红字中的IP地址
RewriteEngine On #Block ip RewriteCond %{http:X-Forwarded-For}&%{REMOTE_ADDR} (188.129.143.73) [NC] RewriteRule (.*) - [F]
3、JS跳转
在head区插入一下的JS:
定期的数据分析是SEOer的一项必须做的工作,它能让你及时发现网站的数据异常,及时处理网站被镜像的状况。以上是笔者的经验总结,观点仅供参考。