建站指南:为什么网站内容无法被搜索引擎抓取?

作者&投稿:敛光 (若有异议请与网页底部的电邮联系)
~

如何确保让搜索引擎轻松抓取您的网站?

如果您的网站无法被搜索引擎抓取,那么可能是以下原因造成的:

1、HTTPS安全实施

如果你最近跳转到HTTPS时,可能没有机会审核或以其他方式出现了识别安全证书的安装问题,进行表面审核时可以帮助你确定是什么在影响HTTPS的转换。

如果你最初购买SSL证书的时候没有考虑到网站稍后用于什么,那么可能会出现分歧。需要记住的一件事是,你在购买证书时必须非常谨慎,确保它涵盖了你想要的所有子域。

如果不这样做,可能会导致一些问题,比如无法重定向URL。

如果你没有获得完整的通配符证书,并且在子域上有URL参数(使用绝对URL),你的证书也没有覆盖这些URL,那么你无法将这些URL重定向到。

这就是为什么在购买SSL证书时要注意你的选项的原因,因为它可能会对你的站点产生负面影响。

2、错误的重定向或过多的重定向会导致网站性能下降

如果不密切关注正在创建的重定向,也很容易创建冲突的重定向。

此外,还很容易让重定向失去控制,导致每个网站URL有数十个或更多重定向,进而导致网站性能下降。

解决此问题的简单方法是:确保你的重定向都是以1:1的比例创建的。

3、HTTPS和HTTPURLs上的内容不应该同时加载

正确的做法是:其中一个重定向到另一个,而不是两者都重定向。如果同时加载两个,那么站点的版本安全就会出现问题。如果你在浏览器中输入网站的URL,请分别测试和。

如果两个URL都加载,则会显示两个版本的内容,重复的URL可能导致重复的内容。

为了确保不会再次遇到此问题,你需要执行以下操作之一,具体取决于站点的平台:

在HTACCESS中创建完整的重定向模式(在Apache/CPanel服务器上);

使用WordPress中的重定向插件强制从重定向。

4、如何在Apache/Cpanel服务器的htaccess中创建重定向

你可以在Apache/CPanel服务器的.htaccess中执行服务器级别的全局重定向。Inmotionhosting有一个很好的教程,教你如何在自己的web主机上强制重定向。

如果强制所有web流量使用HTTPS,你需要用到以下代码。

确保将此代码添加到具有类似前缀的代码之上(RewriteEngineOn、RewriteCond等)。

RewriteEngineOn

RewriteCond%{HTTPS}!on

RewriteCond%{REQUEST_URI}!^/[0-9]+\..+\.cpaneldcv$

RewriteCond%{REQUEST_URI}!^/\.well-known/pki-validation/[A-F0-9]{32}\.txt(?:\Comodo\DCV)?$

RewriteRule(.*)%{HTTP_HOST}%{REQUEST_URI}[L,R=301]

如果你只想重定向一个指定的域,你需要在你的htaccess文件中使用以下代码行:

RewriteCond%{REQUEST_URI}!^/[0-9]+\..+\.cpaneldcv$

RewriteCond%{REQUEST_URI}!^/\.well-known/pki-validation/[A-F0-9]{32}\.txt(?:\Comodo\DCV)?$

RewriteEngineOn

RewriteCond%{HTTP_HOST}^example\.com[NC]

RewriteCond%{SERVER_PORT}80

RewriteRule^(.*)$www.example.com/$1[R=301,L]

注意事项:如果你对自己在服务器进行正确更改没有信心,请确保你的服务器公司或IT人员来执行这些修复。

5、如果你正在运行WordPress网站,请使用插件

修复这些重定向问题简单的方法就是使用插件,尤其是在运行WordPress网站时。

许多插件可以强制到重定向,但这里有一些插件可以使这个过程尽可能轻松:CMHTTPSPro、WPForceSSL、EasyHTTPSRedirection。

关于插件的注意事项:如果你已经使用了太多的插件,请不要再添加。

你可能需要调查你的服务器是否可以使用上述类似的重定向规则(例如,如果你使用的是基于NGINX的服务器)。

这里需要声明:插件的权重会对网站速度产生负面影响,所以不要总是认为新的插件会对你有所帮助。

6、所有的网站链接都应该从改为

即使执行上述重定向,也应该执行此步骤。

如果你使用绝对URL而不是相对URL,更应该这么做。因为前者始终显示你正在使用的超文本传输协议,如果你使用的是后者,那你就不需要多加注意这一点了。

当你使用绝对URL时,为什么需要更改现场链接?因为谷歌将抓取所有这些链接,这可能会导致出现重复的内容。

这似乎是在浪费时间,但事实并非如此。你要确保最终谷歌能够准确地抓取到你的网站。

7、确保从到的转换,不会出现404页面

404页面的突然增加可能使你的网站不能运行,尤其是在和页面之间存在链接时。

此外,由于显示的404页面太多,谷歌没有找到应该抓取的页面会导致抓取预算的浪费。

谷歌的相关负责人JohnMueller指出,抓取预算并不重要,除非是针对大型网站而言。

JohnMueller在推特上表示,他认为抓取预算优化被高估了。对大多数网站来说,没有什么作用,它只能帮助大规模的网站。

“IMO抓取预算被高估了。其实大多数网站都不需要为此担心。如果你正在抓取网页或运行一个数十亿URL的网站,这是很重要的,但对于普通的网站来说这不是很重要。”

SEOPowerSuite相关负责人YauhenKhutarniuk的一篇文章也阐述了这一点:

“从逻辑上讲,你应该关注抓取预算,因为你想让谷歌尽可能多地发现你网站的重要网页。你还希望它能快速地在你的网站上找到新内容,你的抓取预算越大(管理越智能),这种情况就会发生得越快。”

优化抓取预算非常重要,因为快速查找网站上的新内容是重要的任务,同时需要尽可能多地发现网站的优先网页。

8、如何修复可能有的404页面

首先,将404从旧URL重定向到新的现有URL。

有一个比较简单的方法是,如果你有一个WordPress网站,用ScreamingFrog抓取网站,并使用重定向WordPress插件执行301重定向规则批量上传。

9、URL结构不应该过于复杂

在为技术SEO做准备时,URL的结构是一个重要的考虑因素。

你同时须注意这些事情,比如随机生成被索引的动态参数、不容易理解的URL,以及其他可能导致技术SEO实现出现问题的因素。

这些都是重要的因素,因为它们可能会导致索引问题,从而损害网站的性能。

10、更人性化的URL

创建URL时,你可能会考虑相关内容,然后自动创建URL。但是,这可能并不合理。

原因是因为自动生成的URL可以遵循几种不同的格式,这些格式都不是非常人性化。

例如:

(1)/内容/日期/时间/关键字

(2)/内容/日期/时间/数字字符串

(3)/内容/分类/日期/时间/

(4)/内容/分类/日期/时间/参数/

正确地传达URL背后的内容才是重点。由于可访问性的原因,它在今天变得更加重要。

URL可读性越强,效果就越好:如果有人在搜索结果中看到你的URL,他们可能更愿意点击它,因为他们会确切地看到该URL与他们搜索的内容的相关性。简而言之,URL需匹配用户的搜索意图。

许多现有网站使用过时或混乱的URL结构,导致用户参与度低。如果有更人性化的URL,你的网站可能会有更高的用户参与度。

11、重复的URL

在构建任何链接之前需要考虑的一个SEO技术问题是:内容重复。

在涉及内容重复时,以下是主要原因:

(1)在网站的各个部分显著重复的内容。

(2)从其他网站抓取内容。

(3)重复的URL,其中只存在一个内容。

因为当多个URL代表一个内容时,它确实会混淆搜索引擎。搜索引擎很少会同时显示相同的内容,并且重复的URL会削弱他们搜索的能力。

12、避免使用动态参数

虽然动态参数本身并不是SEO方面的问题,但如果你无法管理其创建,并且在使用中保持一致,那么以后可能会成为一个潜在威胁。

JesScholz在搜索引擎杂志上发表了一篇文章,内容涉及动态参数和URL处理的基础知识以及它如何影响SEO。

Scholz解释说,参数用于以下目的:跟踪、重新排序、过滤、识别、分页、搜索、翻译。

当你发现是URL的动态参数导致的问题时,通常将其归结为URL的基本管理不善。

在跟踪的情况下,在创建搜索引擎抓取的链接时可以使用不同的动态参数。在重新排序的情况下,使用这些不同的动态参数对列表和项组进行重新排序,然后创建可索引的重复页面,搜索引擎再对其进行抓取。

如果不将动态参数保持在可管理的水平,可能会无意中引发过多的重复内容。

如果不仔细管理一部分内容的创建,这些动态URL的创建实际上会随着时间的推移而累积,然后会稀释内容的质量,进而削弱搜索引擎的执行能力。

它还会导致关键词“自相残杀”、互为影响,并且在足够大的范围内会严重影响你的竞争能力。

13、较短的URL优于较长的URL

长期以来的SEO实践结果是:较短的URL优于较长的URL。

谷歌的JohnMueller对此表示:“当我们有两个相同内容的URL时,我们需要选择其中一个在搜索结果中显示时,我们会选择短的,这就是规范化。当然长短并不是主要影响因素,但如果我们有两个URL,一个非常简洁明了,另一个有很长的附加参数,而且他们显示相同的内容时,我们更倾向于选择短的。还有很多例子,比如不同的因素发挥作用,但在其他条件相同的情况下——你有一个较短的和较长的,我们也会选择较短的。”

另有证据表明,谷歌对短的URL进行了具体的排序,而不是更长的URL。

如果你的网站包含超长URL,你可以将它们优化为更短、更简洁的URL,以更好地反映文章的主题和用户意图。

建站网站建站指南网站内容


新手站长建站指南:网站到底要不要备案
网站当然要备案,中国对互联网的管理将会越来越严格,对于域名都必须实名制,未来不仅仅是网站的icp备案,还必须在公安局进行备案。如果做的是正规业务,肯定是要备案的,而且网站必须符合互联网广告法,不要使用夸大的词语,以免带来不必要的处罚。

建站指南:百度认为什么样的网站更有抓取和收录价值
百度作为搜索引擎,最终的目的是满足用户的搜索需求,所以要求网站内容首先能满足用户的需求,现今互联网上充斥了大量同质的内容,在同样能满足用户需求的前提下,如果您网站提供的内容是独一无二的或者是具有一定独特价值的,那么百度会更希望收录您的网站。温馨提示:百度希望收录这样的网站:网站能满足一定...

新手站长建站指南:网站备案常识
网站备案是指向主管机关报告事由存案以备查考。行政法角度看备案,实践中主要是《立法法》和《法规规章备案条例》的规定。网站备案的目的就是为了防止在网上从事非法的网站经营活动,打击不良互联网信息的传播,如果网站不备案的话,很有可能被查处以后关停。(2)网站为什么要备案?网站备案是国家相关部门要求...

http:\/\/www.666nba.cn 为何还没有被收录?
百度Spider对网页的抓取,是通过网页与网页之间的链接实现的。 网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。 百度Spider的访问权限,和普通用户是一样的。

国防科技工业自然环境试验站网指南内容简介
在国际交流与合作方面,国防工业自然环境试验站网积极拓展与国际同行的交流合作,共同参与国际标准制定,共享科研成果,促进了全球环境试验领域的协同发展。通过这些合作项目,我国科研人员能够借鉴国际先进经验,提升自身试验技术水平,为国防装备的现代化建设提供强有力的技术支撑。综上所述,国防工业自然环境...

独立站如何做seo优化?独立站网站优化指南
越来越多的人想进军独立站,想在独立站领域建设自己的品牌阵地,获取更多的客户。想要让自己的网站更快被人们发现,除了广告,就是SEO。SEO可以让网站在搜索引擎中获得更好的排名,进而吸引更多潜在客户进入我们的网站,从而达成交易。接下来我们将介绍网站建设时需要注意的一些SEO要点。一、网站结构优化一)确保网站结构清晰...

网页设计:如何确定网站栏目
2、设立最近更新或网站指南栏目 设立"最近更新"的栏目,是为了照顾常来的访客,让你的主页更有人性化。如果主页内容庞大,层次较多,而又没有站内的搜索引擎,设置"本站指南"栏目,可以帮助初访者快速找到他们想要的内容。3、设立可以双向交流的栏目 比如论坛,留言本,邮件列表等,可以让浏览者留下他们...

如何在浏览器中添加Internet可信任站点?
添加可信任站点:浏览器与控制面板双重操作指南 首先,打开浏览器,点击右上角的菜单图标,选择"工具",接着进入"Internet选项"页面(如图所示),或者通过控制面板,定位到"网络和Internet"设置,右键点击网络图标,选择"打开网络和共享中心",再点击"Internet选项"。进入Internet属性界面后,找到并点击顶部的...

6款不可多得的良心网站安利给大家!
第一站:第一教程网 https:\/\/www.diyijc.com\/这个学习殿堂堪称宝藏,全然免费且广告零骚扰。课程覆盖从小学到研究生,涵盖各类资格证书和专业技能,甚至是农业和家居知识,最新课程如2020教师资格考试指南,让你的知识库与时俱进。第二站:偶书 https:\/\/obook.cc\/偶书馆藏丰富,扫描书籍、教材一...

国防科技工业自然环境试验站网指南图书信息
探讨了其在武器装备研发、环境适应性评估、新材料新工艺验证、环境保护与资源利用等领域的应用前景。综上所述,国防科技工业自然环境试验站网指南图书信息是国防科技工业自然环境试验站网建设和运行的权威指南,对于提升国防科技工业环境试验能力,促进科研成果的转化与应用具有重要意义。

义乌市17172779731: 网页迟迟不被搜索引擎收录的原因是什么?+互联网 -
集毕小儿: 如果网站上线之后,站内的网页迟迟不被收录的话,那很可能是网站自身的原因所导致.一般来说,网页不被收录主要有六个方面的因素:1、网页未设置标题或标题中无关键字...

义乌市17172779731: 建立网站为什么不会被搜索引擎收录
集毕小儿:咱们这儿的空间都有送独立IP. 独立IP能极大的提升用户网站被搜索引擎收录级别和机会,也就是一个IP只对应一个网站的话,搜索引擎会认为网站质量很高,提高收录级别,而共享IP条件下,一个IP下对应多个网站,搜索引擎会认为网站质量不高,而降低收录级别.

义乌市17172779731: 网站信息不被收录怎么办 -
集毕小儿: 收录规则:1. 网站的信息(数量、质量、可读性)2. 匹配度(抬头词的设置)3. 网站的权重(建站时间、友情链接、反向链接、爆光率、上线时间、首页变化程度、网站流量) 不被收录的可能1. 非法信息、网站2. 各大引擎还没有发现你的网站(建站时间太短)3. 网站里发布的跳转信息,或是用别的网站发布跳转信息(终点是本站)

义乌市17172779731: 为什么搜索蜘蛛抓取不到我们网站任何内容? -
集毕小儿: 我看了你的网站,你的网站还是存在很多问题的.总之,不符合搜索引擎蜘蛛抓取习惯.你可以从以下几个方面做.1、首页内容太少,特别是文字,页面太短了,搜索引擎抓取不到什么内容,导致他认为收录的意义不大.2、网站栏目过于简单,缺乏内容.3、网站没有有规律更新.4、网站发外链比较少,网站刚刚建立需要发些外链吸引蜘蛛爬行是非常有必要的.

义乌市17172779731: 网站不被搜索引擎收录的因素有哪些 -
集毕小儿: 网站不被搜索引擎收录的原因有很多要点,老渔哥网络分析网站不被搜索引擎搜索的原因有以下几点:1-网站robots协议文件时候是静止所有搜索引擎抓取的写法,若是需要更换成允许所有所有引擎抓取的写法;2-网站页面内容的质量度、页面关键词、页面之间的内链等; 3-网站文章的质量度与更新频率,文章是否是照搬或伪原创的、还是搜索引擎已经收录的文章; 4-网站域名有没有向各大搜索引擎提交,需要提交的入口是搜索引擎抓取的入口等.

义乌市17172779731: 为什么网站不被搜索引擎蜘蛛抓取? -
集毕小儿: 实际上网站不被搜索引擎抓取有好多原因,比如网站的robot文件的设置、网站内容中都是FLASH或者java、一个页面使用太多的链接等等,详情请点击参考资料进行了解.

义乌市17172779731: 网站页面不被收录的原因是什么 -
集毕小儿: 1、网站内容多次重复 这一个是绝大多数文章不被搜索引擎收录的原因,所以我把它放在第一位,虽然这个是老生常谈的话题了,但是我还是想给各位手里有低权重的站长说一下.因为我相信绝大部分的站长每天都在做这件事,随便把几篇主题...

义乌市17172779731: 为什么网站一直没有索引量 -
集毕小儿: 网站一直没有索引量有以下几方面原因:1、新站上线不久,网站还处于考察期2、网站内容过少,很少更新网站内容3、网站外链过少,外链少无法引蜘蛛

义乌市17172779731: 造成网站一直不被收录的原因是什么?+互联网
集毕小儿:一/网站优化 原因: 优化过度,比如堆积关键字,隐藏文字等等.如果出现这样的情况,bd就算已经收录了你,别庆幸自己蒙混过关,因为在更新的时候也会慢慢剔除的.二级域名和博客交叉连接. 解决方法:新网站上线,不要先进行过多的...

义乌市17172779731: 为什么上网站没有被收录 -
集毕小儿: 没有比搜索引擎 将自己呕心沥血建好的网站拒之门外更让人郁闷的事了.但如果是新站,不要心急,隔一段时间就会收录的!1、各种搜索引擎对新站的收录有所不同.google、雅虎等搜索引擎对新站是比较容易收录的,而百度对新站不会很...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网