Google搜索排名核心系统底层技术指南

SEO1413,37421阅读模式

Google使用自动化排名系统,这些系统会查看有关Google搜索索引中的数千亿网页和其他内容的许多因素和信号,以提供最相关、最有用的结果,所有这些操作都能在几秒内完成。

Google会定期通过严格的测试和评估来改进这些系统,并在排名系统更新时发出通知(如果这些更新可能会对内容创作者等有所帮助)。

本文将介绍Google的一些更加知名的排名系统。其中介绍了Google的核心排名系统中的一些系统,这些系统是针对查询生成搜索结果的底层技术。此外,还介绍了涉及特定排名需求的一些系统。

Google搜索排名核心系统底层技术指南

您还可以访问Google的Google搜索的工作方式网站,了解Google的排名系统如何与其他流程协同运作,让Google搜索能够实现Google的使命,即整合全球信息供大众使用,使人人受益。

BERT

Bidirectional Encoder Representations from Transformers(BERT)是Google使用的AI系统,可让Google了解字词的不同组合如何表达出不同的含义和意图。

灾难信息系统

Google开发了多个系统,以便在发生灾难时(无论是个人危机情况、自然灾害还是其他大范围扩散的灾难情况)提供及时且实用的信息:

个人危机:Google的系统会努力了解人们何时在寻求个人危机方面的信息,并在有关自杀、性侵、中毒、性别暴力或毒瘾等的特定查询时显示热线和受信任组织的内容。

SOS警报:在自然灾害或大范围的灾害发生期间,Google的SOS警报系统会尝试显示当地、全国或国际机构发布的资讯。这些资讯可能包括紧急电话号码和网站、地图、有用短语的翻译、捐赠机会等。

重复信息删除系统

在Google上搜索时,您可能会看到数千个甚至数百万个匹配的网页。其中某些参数可能彼此非常相似。在这种情况下,Google的系统会仅显示最相关的结果,以避免无益的重复信息。

Google在删除重复信息时也会考虑精选摘要。即使网页详情被提升为精选摘要,Google也不会在搜索结果的第一页重复显示此列表。这样有助于整理搜索结果,帮助用户更轻松地找到相关信息。

完全匹配网域系统

Google的排名系统会将域名中的字词视为判断内容是否与搜索相关的众多因素之一。但是,Google的完全匹配网域系统会确保,对于专门为了与某些查询完全匹配而创建的网域下托管的内容,Google不会过多考虑。例如,用户可能会创建一个包含“最好吃的午餐饭馆”字样的域名,希望该域名中的所有这些字词都能提升内容的排名。Google的系统会做出相应调整。

更新系统

Google有各种“查询应保持新鲜度”系统,旨在针对查询显示预期的更新鲜内容。例如,如果有人搜索的是刚上映的电影,他们可能想要的是最新影评,而不是自影片制作开始以来的旧报道。再举一个例子,一般情况下,搜索“地震”可能会返回有关地震准备和资源的内容。不过,如果近期发生了地震,那么可能会出现新闻报道和较新的内容。

实用内容系统

Google的实用内容系统旨在确保用户在搜索结果中看到由用户撰写、面向用户的原创实用内容,而非主要用于获取搜索引擎流量的内容。

链接分析系统和PageRank

Google拥有多种系统,能够了解网页之间的链接方式,从而确定网页相关内容,以及哪些网页可能与查询最相关。其中就包括PageRank,这是Google首次发布时采用的核心排名系统。对此感兴趣的人可以参阅原始的PageRank研究论文和专利来了解详情。自此之后,PageRank的运作方式发生了很大变化,并一直是Google核心排名系统的一部分。

本地新闻系统

Google有相应的系统,负责识别和适时展示当地新闻媒体,例如通过“焦点新闻”和“本地新闻”功能。

Google搜索排名核心系统底层技术指南

MUM

Multitask Unified Model(MUM)是一种能够理解和生成语言的AI系统。它目前不用于Google搜索的一般排名,而是用于某些特定应用,例如用于改进COVID-19疫苗信息的搜索和改进精选摘要标注。

神经匹配

神经匹配是一种AI系统,Google使用它来理解查询和网页中概念的表示形式,并将它们相互匹配。

原创内容系统

Google有相应系统来确保在搜索结果的显眼位置显示原始内容(包括原创性报告),并将它们排在引用内容前面。其中包括对特殊规范标记的支持,如果网页在多个位置存在重复版本,创作者可以使用该标记来帮助Google更好地了解哪个是主要网页。

基于移除的降位系统

Google的政策允许移除某些类型的内容。如果Google处理了涉及特定网站的大量此类移除要求,Google将以此作为衡量因素来改进Google的搜索结果。具体而言:

依法移除:如果收到大量涉及特定网站的有效版权内容移除要求,Google会据此降低该网站中其他内容在搜索结果中的排名。这样,如果存在其他侵权内容,用户更可能看到原始内容,而非相应侵权内容。对于涉及诽谤、仿冒产品和法院命令移除的投诉,Google会采用类似的降位衡量因素。

个人信息移除:如果Google处理的大量个人信息移除要求涉及某个采用有偿移除做法的网站,Google会降低该网站中其他内容在搜索结果中的排名。Google也会设法了解其他网站是否存在同类行为;如果存在,则对此类网站上的内容采取降位措施。对于收到大量人肉搜索内容移除要求的网站,Google可能会采取类似的降位做法。此外,Google还采取了自动保护措施,以防止未经当事人同意而发布的露骨个人图片在涉及相关姓名的查询中获得较高的排名。

网页体验系统

用户更喜欢提供良好网页体验的网站。因此,Google制定了网页体验系统来评估各种标准,例如网页加载速度、移动设备适用性、网页是否不存在干扰性插页式广告,以及网页呈现过程是否安全。如果存在多个相关性相对一致的可能匹配网页,系统会优先考虑具有更好网页体验的内容。

段落排名系统

段落排名是一个AI系统,用于识别网页的各个部分或“段落”,以便更好地了解网页与搜索内容的相关程度。

商品评价系统

商品评价系统旨在更好地奖励优质商品评价,其内容包含见解深刻的分析和原创研究,并且由熟知相应主题的专家或爱好者撰写。

Google搜索排名核心系统底层技术指南

RankBrain

RankBrain是一个AI系统,可帮助Google了解字词与概念之间的关系。这意味着,即使内容不包含某个搜索查询中使用的所有完全匹配的字词,Google也可以了解这些内容与其他字词和概念的相关程度,从而更好地返回相关内容。

可靠信息系统

多个系统以各种方式显示尽可能最可靠的信息,例如帮助呈现更权威的网页和降低劣质内容的排名,以及提升优质新闻的排名。如果可能缺乏可靠的信息,或者Google的系统对搜索结果的总体质量不太有信心,Google的系统会自动显示有关快速变化的主题的内容建议。这些内容建议会提示您如何找到可能更实用的搜索结果。

网站多元化系统

Google的网站多元化系统可确保Google一般不会在热门搜索结果中显示来自同一网站的两个以上的网页商品详情,这样就不会有单个网站霸占热门搜索结果。不过,如果Google的系统发现,同一网站的两条以上的商品详情与特定搜索非常相关,可能仍会显示两条以上这样的商品详情。网站多元化系统通常将子网域视为根网域的一部分。例如:系统会将子网域(subdomain.example.com)和根网域(example.com)中的商品详情视为来自同一个网站。不过,有时出于多元化目的,会将子网域视为不同的网站。

网络垃圾检测系统

没有人希望电子邮件收件箱充满垃圾邮件,因此垃圾邮件过滤器非常有用。Google搜索面临着类似的挑战,因为互联网包含大量网络垃圾,如果不处理这些网络垃圾,系统将无法显示最有帮助且最相关的结果。Google采用了一系列的网络垃圾检测系统(包括SpamBrain)来处理违反网络垃圾政策的内容和行为。这些系统会不断更新,以便及时掌握网络垃圾威胁的最新演变方式。

已经弃用的系统

下文所述的系统主要用于历史参考用途。它们已被并入接替系统,或已成为Google核心排名系统的一部分。

蜂鸟系统

这是Google在2013年8月对整体排名系统进行的一项重大改进。此后,Google的排名系统一直在不断发展,就像它们之前一直在发展一样。

移动设备适合性排名系统

如果存在多个相关性相对相同的可能匹配内容,移动设备适合性排名系统会优先考虑在移动设备上能更好地呈现的内容,适合移动设备的内容对于使用这些设备进行搜索的用户更有用。该系统随后已整合到Google的网页体验系统中。

网页速度系统

Google于2018年宣布推出该系统,最初将其命名为“速度更新”,这意味着在所有条件相同的情况下,在移动设备上加载速度更快的内容在移动搜索结果中表现更好。此后,它已融入Google的网页体验系统。

熊猫系统

该系统旨在更好地确保在Google搜索结果中呈现优质的原创内容。Google于2011年宣布推出这个昵称为“熊猫”的系统,该系统经过不断发展,于2015年成为Google核心排名系统的一部分。

企鹅系统

这是一个旨在防范垃圾链接的系统。Google于2012年宣布推出这个昵称为“企鹅更新”的系统,并在2016年将其整合到Google的核心排名系统中。

安全网站系统

这个系统于2014年推出,该系统规定:当一切衡量因素保持对等时,采用HTTPS技术进行保护的网站在Google的排名系统中会表现得更好。当时,使用HTTPS的情况依然不常见,正是该系统推动了安全网站的发展。从此以后,它已成为Google网页体验系统的一部分。

如果你觉得本文对你有用,请收藏本站,以备不时之需。

我的微信
微信扫一扫
weinxin
我的微信
微信公众号
微信扫一扫
weinxin
我的公众号
阿里云广告
 
guangwei
  • 本文由 guangwei 发表于 2023年6月30日 06:00:00
  • 转载请务必保留本文链接:https://www.guangweiblog.com/seo/1839.html
  • 排名系统
  • Google排名
  • Google核心系统
  • Google AI系统
评论  14  访客  9  作者  5
    • 姜辰Jcs.Moe
      姜辰Jcs.Moe 1

      专业

      • 夏日博客
        夏日博客 2

        谷歌的核心排名指南要弄懂了有一定的难度。

        • wu先生
          wu先生 2

          哈哈,不懂,不明觉历。 :mrgreen:

          • Jeffer.Z
            Jeffer.Z 2

            我的一个英文站,因为生成了大量gpt内容,被识别直接被谷歌k0展示了,感觉谷歌太智能啦。

              • guangwei
                guangwei

                @ Jeffer.Z 这个还是需要做些改动比较好

              • 淘好源资源网
                淘好源资源网 2

                不知道怎么申请google 广告联盟罗。

                • ccbbp
                  ccbbp 0

                  博主用的谁家的服务器,速度好快

                    • guangwei
                      guangwei

                      @ ccbbp 阿里、腾讯都很不错的

                    • 爱比宝
                      爱比宝 0

                      感谢分享,干货慢慢

                      • 兔宝宝游戏网
                        兔宝宝游戏网 1

                        最好谷歌优化,那就真的厉害了。

                        • Dabenshi
                          Dabenshi 1

                          贵站广告有点多呀

                            • guangwei
                              guangwei

                              @ Dabenshi Adsense自动广告优化,一般设置在5个以内呢

                          匿名

                          发表评论

                          匿名网友

                          :?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

                          确定