锟斤拷锟脚讹拷态

网站文章不收录原因分析及解决方案
发布人:求是文化传播 发布时间:2017/1/4 点击:7963次

 一、搜索引擎不收录文章到底是什么原因导致的?

  1、网站是新站

  如果网站是新站,那么网站是在审核期,搜索引擎对网站的信任度还很低,文章收录率比较低这是正常现象,原因是网站并没有在搜索引擎获得足够的综合页面评分数,所以大部分新站只是收录了首页,或一两个内页链接。一般搜索引擎在新站停留时间不会很久的!

  解决方法:

  ①、建议把网站首页和内页进行发布一下外链,诱惑蜘蛛来爬取,进而增加baiduspider在网站的停留时间!

  ②、到百度站长平台提交链接,为baiduspider提供爬取通道入口

  2、网站的文章大部分是采集复制过来的

  网站的文章大部分是采集复制过来的,导致网站文章不收录或者收录率极低,该怎么增加网站的收录呢?这种情况目前在互联网上情况最多的,情况基本出于你网站没有得到搜索引擎的信任,没有新鲜内容的支撑。反之,有些网站即使伪原创也可以达到秒收,那也是该网站已经得到搜索引擎很高的信任度了。面对大部分网站是采集或者伪原创,而相对都比较渴望得到解决方法,而往往都没有真正的被解决!下面这几种方法会为你解决这个问题!

  解决方法:

  ①、通过百度站点工具主动推送和外链发布引诱baiduspider来网站抓取文章,如果过了一两天都还没收录,可以通过网站日记查看baiduspider是否有在抓取这条连接,如果有在抓取连接,但是就是不收录,那么就要进行下一步计划了!

  ②、修改标题以及内容正文的开头部分,没错,进行修改一下这篇文章的标题以及内容,baiduspider有在抓取这条页面连接但是就是不收录,说明这篇文章重复率相似度很高,搜索引擎索引库已经存有大量同样/相似的文章,没有必要再去收录了。通过修改文章标题以及内容这是很有效的办法,如果还不收录再继续修改一下正文的内容,这样收录将有很大的提升。

  ③、在各种不同的平台,多发布几次外链,并在底部填写该页面的链接,对该页面也有一定增加收录的。

  ④、重新更新制作一个sitemap文件,把网站的链接全部提交百度站长平台的链接提交选项进行提交。老虎sitemap生成器可以实行效果,这种情况使用最好是一个网站大量文章是采集得来的,对此这种方法还是有一定的帮助的。

  3、更新文章的都是过时过期的文章,老生常谈之内容。

  有些网站更新的文章都是一些过期过时的、老生常谈的内容,搜索引擎都不知道过滤N遍了,居然在你网站又出来,然后结果肯定是悄悄地来,轻轻地走。所以即使采集也要采集一些新鲜内容,这样收录率才会有所提升。到了这里,可能有些SEOER会问我,SEO文章不就是那几篇文章写来写去吗?那你告诉我什么是新鲜内容。我只想说,你不去创新,永远都是采集来的文章,那为什么别人又可以创作新鲜的内容呢?

  解决方法:

  ①、多去一些问答平台,交流论坛去走动,看看他们交流的一些核心问题还有什么是没有解决的?然后你通过各种资源、人脉、网络整理出一个新颖的文章。

  ②、给网站写一些独特软文、故事式软文,增加网站的新鲜血液,提升网站的原创性对网站的收录率有很大的提升。

  4、内容出现敏感词,baiduspider排斥

  写文章尽量使用一些规范的语句来描述,不要弄一些用户无法看懂,baiduspider无法识别繁字体,特别是一些百度和论坛都屏蔽的语句,也许是文章内容存有敏感词而导致文章不收录索引呢!虽然这种情况存在几率较小,但是还是有一定的几率存在的。

  解决办法:

  ①、在不收录的页面自行检查是否存在敏感词,也可以在百度搜索敏感词在线检测工具进行检测,把一些存有敏感词的语句去掉。

  5、文章更新的是原创文章,但还是不收录或者收录较慢

  像这种情况,是因为网站在搜索引擎的索引库页面综合评分不是高,搜索引擎对网站的青睐度是很低的。

  解决办法:

  ①、更新一些新鲜内容,不要更新的一些文章是二次制作,过时过期、老生常谈的文章内容。

  ②、为网站多制作一些链接爬取通道,比如多交换几条友链,各平台外链的发布,诱引蜘蛛来网站抓取链接。

  ③、对网站进行整站优化,提升网站的综合评分,baiduspider不来收录,有很大的因素是因为网站的综合评分不高,这时候要把网站综合评分提高,比如把一些不参与排名的页面链接用nofollow标签掉,并更新一些高质量的文章,吸引更多用户来网站浏览,把控好页面的跳出率,尽量原创最好。但是低质量的原创文章还是不要更新,什么是低质量的文章?写的文章网络观点千篇一律,只是稍微换种说法,二次创作罢了,百度搜索切词技术还是挺强大,还是能够检测出来的。

  6、频繁修改标题和网站结构以及网站标签也会影响收录

  网站如果经常修改标题和网站结构及标签,会被搜索引擎重新拉入观察室,重新对网站进行考察以及排名排序,不仅降低搜索引擎对网站信任度,甚至还有可能引发降权的迹象,而且对网站的收录也有一定阻碍,百度快照日期也不会更新。

  解决办法:

  ①、到百度服务中心/快照更新投诉到百度中心审核,进行百度快照申诉更新,可以加快快照的更新速度。

  ②、多更新几篇高质量原创内容进行恢复排名,百度快照和排名会有所恢复。

二、导致百度搜索引擎不收录文章的其他因素

  7、robots文件禁止搜索引擎抓取

  是否在最近有动过robots文件设置,不小心把文章html的链接都禁止爬取了,到百度站长平台进行检查一番,如果存在有异常,直接到后台修改回来即可!

  8、网站存在大量404、503没有进行处理,影响页面索引

  如果网站存有大量404、503错误页面,会导致搜索引擎很难抓取页面的,对于搜索引擎来说,你网站的内容价值和链接数量决定搜索引擎在你网站的停留时长,而且存于大量死链对网站的综合评分也会有所降低的,所以一定要及时地去处理好死链。

  解决办法:可以利用一些死链检测工具来为网站检测,比如:xenu、爱站工具等去检测死链,然而把死链连接放在txt格式文件,上传到网站根目录,最后到百度站长平台死链提交选项,把死链文件提交上去等待即可!

  9、网站优化过度,网站降权引起的百度不收录

  网站无论优化过度还是出现降权了,都是导致baiduspider不收录页面的,这时候需要自己分析最近几天对网站做了什么,是否不小心导致优化过度了,或者做了一些令搜索引擎排斥的事情,思考分析一下,找出原因并修改回来即可!

  10、频繁在主动推送提交未收录页面

  文章编辑发布后,一般人都会去百度站长平台提交链接或者主动推送链接,这本来是好事,但是你看着文章提交链接好几天了还不收录,于是你每天都去提交一篇这条链接,甚至有些还是提交几次来着,咬着牙说,看你还不收录。但是往往你越是这样,网站对收索引擎信任度越低。我们知道网站内容页收录,涉及到搜索引擎最基本的原理,那就是爬行,抓取,建立索引,收录等过程,这原本是搜索引擎来网站抓取主动行为啊,你要明白,百度提供提交链接入口,主要原因是维护原创的利益,让SEO优化的人员编辑文章发布后,第一时间提交链接为搜索引擎提供爬取入口来网站抓取,防止被其他人抄袭。但是站长们完全搞混了当初百度建立主动推送的真正意义。

  解决办法:原创文章编辑发布后,使用主动推送入口最后,更快能让搜索引擎来抓取网站文章链接,但是你提交链接后就不要再提交了,可以通过日记分析搜索引擎有没有来网站抓取该链接,如果抓取了,但还是没有收录,这时候你不要再去推送链接,可以适当地去修改一下文章的标题及内容,也有可能是你文章标题在互联网上已经存在一模一样的,或者文章已经存在千篇一律,适当地去修改能够使搜索引擎更好的收录。

  11、服务器问题

  若是服务器响应速度慢,经常会出现打不开,那么baiduspider来网站抓取页面就会收到阻碍。从所周知,搜索引擎来网站抓取页面的时间是有限制的,当然网站权重越高,抓取页面时间越长。如果导致大量服务器访问速度稳慢的因素存在,或者主机空间是国外或者是香港主机,那么就会导致搜索引擎来网站抓取页面的速度没有达到最佳效果,也许没有抓取几个页面,搜索引擎就离开了网站了。

  解决办法:

  ①、求是文化传播建议购买国内备案主机服务器(T:0576-87785079),一个网站想要长期发展,好的服务器是必须具备的,无论是对用户访问还是对搜索引擎抓取页面好处还是很显然的。

  ②、利用好robots文件,也能让搜索引擎很好的抓取页面,把一些不参与排名和无需抓取的页面Disallow掉,让搜索引擎不必在不重要的页面徘徊抓取,让搜索引擎放在重要的页面抓取,省掉不必要的抓取时间。

  ③、减少HTTP请求提高网站的访问速度,尽可能的减少页面中非必要的元素,一般由图片、form、flash等等元素都会发出HTTP请求,合并脚本和CSS文件可以使网站减少HTTP请求。

  ④、网站避免出现过量的死链,也会使搜索引擎重复抓取死链浪费抓取配额时间,从而影响网站收录,而且大量出现死链会降低网站的综合评分,所以及时的发现死链并处理掉就变得尤其重要。