How can we help?
< All Topics
Print

Google搜索-排名算法

搜索算法的工作原理

由于网络上可用的信息量很大,如果没有一些帮助进行分类,几乎不可能找到您需要的信息。Google 排名系统旨在做到这一点:在搜索索引中对数千亿个网页进行排序,以在几分之一秒内找到最相关、最有用的结果,并以一种可帮助用户找到所需内容的方式呈现寻找。

这些排名系统不是由一个算法组成,而是由一系列算法组成。为了向用户提供最有用的信息,搜索算法会考虑许多因素,包括:

  • 查询的关键词的含义
  • 网页的相关性
  • 内容质量
  • 网页的可用性
  • 上下文和设置

应用于每个因素的权重因查询的性质而异。例如,内容的新鲜度在回答有关当前新闻主题的查询方面比在字典定义方面起着更大的作用。

为帮助确保搜索算法符合相关性和质量的高标准,Google有一个 严格的流程,其中包括实时测试和来自世界各地的数千名经过培训的外部搜索质量评估员。这些质量评估员遵循严格的指导方针,这些 指导方针定义了我们的搜索算法目标,并且任何人都可以看到。

在下面详细介绍有助于确定搜索结果的关键因素。

查询的关键词的含义

要为用户的查询返回相关结果,Google首先需要确定用户要查找的信息:查询背后的意图。理解意图从根本上来说是关于理解语言,这是搜索的一个关键方面。我们构建语言模型来尝试破译我们应该在索引中查找哪些词串。

这涉及看似简单的步骤,如解释拼写错误,并扩展到通过应用一些关于自然语言理解的最新研究来尝试理解您输入的查询类型。例如,我们的同义词系统通过确定多个词的意思来帮助搜索引擎了解您的意思。此功能允许搜索将查询“如何更换灯泡”与描述如何更换灯泡的页面进行匹配。该系统花了五年多的时间开发并显着改善了超过 30% 的跨语言搜索的结果。

除了同义词之外,搜索算法还尝试了解用户正在寻找的信息类别。这是一个非常具体的搜索还是一个广泛的查询?是否有诸如“评论”或“图片”或“营业时间”之类的词表明搜索背后需要特定的信息?查询是用法语写的,这表明用户想要该语言的答案吗?或者用户正在寻找附近的商家并需要本地信息?

此查询分类的一个特别重要的维度是Google对用户的查询是否正在寻找新鲜内容的分析。如果用户搜索热门关键字,Google的新鲜度算法会将其解释为最新信息可能比旧页面更有用的信号。这意味着当用户搜索最新的“NFL 得分”、“与明星共舞”结果或“埃克森美孚收益”时,用户将看到最新信息。

网页的相关性

接下来,算法会分析网页的内容,以评估该网页是否包含可能与用户要查找的内容相关的信息。

信息相关的最基本信号是网页包含与用户的搜索查询相同的关键字。如果这些关键字出现在页面上,或者出现在文本的标题或正文中,则信息更有可能是相关的。除了简单的关键字匹配之外,Google还使用聚合和匿名的交互数据来评估搜索结果是否与查询相关。Google将这些数据转化为信号,帮助Google的机器学习系统更好地估计相关性。

这些相关性信号可帮助搜索算法评估网页是否包含用户的搜索查询的答案,而不仅仅是重复相同的问题。试想一下:当用户搜索“dogs”时,用户可能不希望页面上有数百次“dogs”一词。考虑到这一点,算法会评估页面是否包含关键字“狗”之外的其他相关内容——例如狗的图片、视频,甚至品种列表。

请务必注意,虽然Google的系统确实会寻找此类可量化信号来评估相关性,但它们并非旨在分析主观概念,例如页面内容的观点或政治倾向。

内容质量

除了将查询中的词与网络上的相关文档进行匹配之外,搜索算法还优先考虑最可靠的可用来源。为此,Google的系统试图识别可帮助确定哪些页面展示给定主题的专业知识、权威性和可信度的信号。

Google寻找许多用户可能对类似查询很看重的网站。例如,如果其他著名网站链接到该页面(即所谓的PageRank),这是被证明是该信息值得信赖的。来自Google的搜索质量评估流程的汇总反馈用于进一步完善我们的系统识别信息质量的方式。

垃圾邮件算法在确定页面是否低质量方面发挥着重要作用,并帮助搜索确保网站不会通过欺骗或操纵行为在搜索结果中上升。Google 的网站管理员指南概述了表征此类低质量垃圾邮件网站的技术,包括购买传递 PageRank 的链接或将不可见文本偷偷带入页面。

网络上的内容和更广泛的信息生态系统不断变化,Google不断衡量和评估系统的质量,以确保在信息相关性和权威性之间取得适当的平衡,以保持用户对所看到结果的信任。

网页的可用性

在对结果进行排名时,Google 搜索还会评估网页是否易于使用。当Google确定持续存在的用户痛点时,Google会开发算法以在所有其他条件相同的情况下,将更多可用页面推广到不太可用的页面之前。

这些算法分析表明所有用户是否都能够查看结果的信号,例如网站是否在不同浏览器中正确显示;是否适用于所有类型和尺寸的设备,包括台式机、平板电脑和智能手机;以及页面加载时间是否适合互联网连接速度较慢的用户

由于网站所有者可以提高其网站的可用性,因此Google会努力提前通知网站所有者搜索算法发生重大的、可操作的更改。例如,在 2018 年 1 月,Google宣布算法将在更改生效前六个月开始考虑网站的“页面速度”。为了帮助网站所有者,Google提供了详细的指南和工具,例如PageSpeed InsightsWebpagetest.org,以便网站所有者可以看到他们需要进行哪些调整(如果有的话),以使他们的网站对移动设备更加友好。

用户可以在此处找到有关 Google 为网站所有者提供的工具和提示的更多信息

上下文和设置

用户的位置、过去的搜索历史记录和搜索设置等信息都有助于Google根据当时对用户最有用和最相关的内容定制该用户的结果。

Google使用用户所在的国家/地区和位置来提供与用户所在地区相关的内容。例如,如果用户在芝加哥并搜索“足球”,Google 很可能会首先向您显示有关美式足球和芝加哥熊队的结果。而如果用户在伦敦搜索“足球”,Google 会将有关足球和英超联赛的结果排名更高。搜索设置也是您可能会发现哪些结果有用的重要指标,例如用户是否设置了首选语言或选择了安全搜索(一种帮助过滤掉露骨结果的工具)。

在某些情况下,Google还可能使用有关用户最近的搜索活动的信息来个性化您的结果。例如,如果用户搜索“巴塞罗那”并且最近搜索了“巴塞罗那对阵阿森纳”,这可能是用户想要了解足球俱乐部而非城市信息的重要线索。

搜索还包括一些功能,可根据用户的 Google 帐户中的活动对结果进行个性化设置。例如,如果用户搜索“我附近的活动”,Google 可能会针对用户可能感兴趣的活动类别定制一些建议。这些系统旨在满足用户的兴趣,但它们并非旨在推断用户的种族等敏感特征,宗教或政党。

用户可以在myaccount.google.com 上控制使用哪些搜索活动来改善用户的搜索体验,包括调整将哪些数据保存到用户的 Google 帐户。要根据用户帐户中的活动禁用搜索个性化,请关闭网络与应用活动记录。

Previous Google搜索-内容组织
Next Google搜索-展现方式
Table of Contents