Google搜索原理之算法

发布于 来源 原文链接

1天前 有1个用户阅读过

对于常规查询,就算没有数百万,也有数千个包含相关实用信息的网页。算法是一种接受您的问题并返回相应答案的计算机过程和公式。目前,Google 的算法会根据 200 多种独特的信号或"线索"进行计算,从而推测出您真正的搜索意图。这些信号包括网站上的字词、内容的新鲜程度、您所在的地区以及 PageRank

搜索项目

搜索过程和获得结果页包含很多部分。我们一直致力于更新技术和系统,以提供更好的搜索结果;其中很多更改涉及知识图或 Google 即搜即得等令人振奋的新创意。还有一些重要的系统是我们一直在调整和优化的。下列项目可让您大概了解搜索的众多不同方面。

答案

显示天气信息、比赛成绩和时事快讯之类的内容的即时答案和信息。

自动填充

预测您可能要搜索的内容。这包括理解具有多种含义的字词。

图书

从数以百万计的图书中(包括来自全球各地的图书馆和出版商处的预览和文字)查找结果。

时效性

显示最新的新闻和信息。这包括当您搜索特定日期时收集及时结果。

Google 即搜即得

在您输入时显示即时结果。

图片

为您显示带有缩略图的图片结果,让您一眼就能确定要访问哪个网页。

索引编制

使用适于在网络上收集并存储文档的系统。

知识图

根据现实世界的人、地点、事物及它们之间的联系提供结果。

移动

包括专门针对平板电脑和智能手机之类的移动设备进行的改进。

新闻

包括来自全球的网络报纸和博客的结果。

对查询的理解

了解您输入的字词的深层含义。

优化

提供"高级搜索"、相关搜索等功能以及其他搜索工具,所有这些都可以帮助您提高搜索的准确性。

安全搜索

减少您结果中的成人网页、图片以及视频的数量。

搜索方法

创建新搜索方法,包括"按图搜索"和"语音搜索"。

网站和网页质量

通过一系列的线索确定来源的可信度、信誉或权威程度(其中一个线索是 PageRank,它是 Google 最初使用的算法,会通过网页之间的链接关系确定它们之间的相关程度)。

片段

显示信息的小范围预览,例如网页标题和各搜索结果的简短描述文字。

拼写

找出并纠正可能存在的拼写错误,并提供备选字词。

同义词

识别具有相似含义的字词。

翻译与国际化

根据您所用的语言和所在的国家/地区定制结果。

全面搜索

将具有相关性的内容(比如图片、新闻、地图、视频和您的个人内容)通通纳入一个统一的搜索结果页。

用户环境

根据地理位置网络历史记录以及其他因素提供相关度更高的结果。

视频

显示带有缩略图的视频结果,以便您快速确定要观看哪个视频。

搜索的发展历程

我们的目标是让您能更快地找到需要的答案,享受近乎完美的流畅体验。如果您想要深入了解搜索的发展过程,请观看此视频,其中重点说明了通用结果和快速解答等重要功能。

实验:从创意到发布

通常,算法更改一开始只是我们的某个工程师提出的一个搜索改进想法。具体实施与否完全要用数据来说话,而且所有的算法更改提案都需要经过大量质量评估才能发布。

通常,工程师会先进行一系列实验,对小变量进行微调,然后从同事处获取反馈。直到满意后,他们才会准备向更大范围的受众群体发布该实验。

搜索质量评估员指南

此文档是我们的一份搜索质量评估员指南,可作为搜索质量评估员的培训材料。其中主要介绍了一类名为"网址评分"的评分任务,此类任务要求评估员查看搜索查询与可能返回的相应结果。他们需要根据此文档所述的标准对结果与查询间的相关程度进行评分。听上去很简单,是吧?但正如您看到的一样,其实有很多棘手的情况需要仔细辨别。

立即下载(仅提供英文版)

此图显示从实验逐步精简为实际发布的算法更新项的过程

精确度评估次数

41,831

在第一个阶段,我们会获取评估员的反馈,这些评估员都接受过搜索质量评估培训。我们会向评估员显示一些搜索结果,请他们就指定的搜索对这些结果的实用性进行评分。请注意:这些评分不会对排名造成直接影响

对比实验数

9,250

在对比实验中,我们向评估员显示了两组不同的搜索结果,其中一组来自旧版算法,另一组则来自新版算法。然后,我们详细询问了评估员他们认为哪一组结果的相关程度更高。

实时流量实验次数

7,362

如果评估员的反馈良好,我们会继续进行"实时流量实验"。在这些实验中,我们让一小部分真正的 Google 用户实施该搜索,然后查看这会对他们与结果间的交互产生怎样的影响。我们会仔细分析这些结果,以了解此更改能否改进搜索结果。例如,搜索者点击新的首个结果的频率是否有所提高?如果是的话,一般来说这是好现象。

发布的项

538

最后,我们最资深的搜索工程师会仔细检查所有不同实验所得出的数据,然后再决定是否批准发布相应更改。这听上去很复杂,但实际过程已非常完善;因此对于工程师而言,从迸发创意到面向部分 Google 用户发布只需 24 小时。在所有这些实验、评估和分析的基础上,我们 2011 年针对搜索发布了 538 项改进。

2011 年的数据

-- The End --

本文标题: Google搜索原理之算法

本文地址: https://seonoco.com/blog/algorithm-of-google-search-principle

原文地址: http://www.google.com/intl/zh-CN/insidesearch/howsearchworks/algorithms.html

本文是否有所帮助?
点赞 0
感谢支持
0
多谢反馈
评论 0
打赏

支持微信/支付宝

评论

网友