网站迟迟不被百度收录原因:
1.200以外响应代码:
如果页面没有生成200服务器响应代码,那么就不要指望搜索引擎将它们编入索引。有时URL会被进行意外重定向,产生404或 500错误,具体取决于CMS问题,服务器问题或用户错误。如出现该种问题,请抓紧时间检查以确保正确加载页面网址。
2.Robots.txt阻止:
网站的robots.txt文件可以说是为百度提供了抓取命令。如果网站上的某个特定网页缺少不被百度索引,那么robots.txt文件是先要检查地方之一,如果要查看URL是否被robots.txt文件阻止,请去百度站长管理平台进行“抓取诊断”测试即可。
3.“Noindex”元机器人标签:
网站上的某个网页可能无法在百度中编入索引的另一个原因就是,可能在网页的<head>中有一个“noindex”元机器人标记。而一旦百度看到这个元机器人标签,则将始终遵从此命令进行。而我们想要检查网页是否有“noindex”元机器人标记,就可查看源代码并在<head>中查找代码。如果网站通过javascript进行渲染的话,那么就需要通过使用Google Chrome“检查元素”功能才能正确查看<head>。
4.“Noindex”X-Robots标签:
5.内容重复:
内容重复是网站优化中让众多站长比较头疼的问题,毕竟大量的重复内容将会使得我们的网页远离百度索引,如果网页上重复内容过多,那么必将对排名造成不小的影响。
6.整体指数缺乏价值:
特定页面或整个网站内容可能非常差,以至于无法为百度索引提供足够价值。比如只有动态生成广告的联盟网站对用户是毫无参考价值。百度已经改进了算法,以避免这样的网站获取好的排名。
7.网站仍是新的和未经证实的:
新网站不会被百度和其它搜索引擎迅速编入索引,它需要链接和其它信号才能让百度在其搜索结果中对网站进行索引和排名。这也就是为啥说链接建设对新网站尤为重要的一个原因,对于刚刚上线的网站而言,可以在上线后直接向百度提交链接请求,通常会在1小时左右网站主页就会被收录了。