搜索引擎如何使用机器学习:我们需要知道的9种方式
2018年02月24日 由 nanan 发表
579340
0
当我们在2010年初初次听到机器学习的时候,可能会感觉它很可怕。
但当我们意识到技术已经被用来为我们提供解决方案时,我们就开始着手解决实际问题:
—搜索引擎如何使用机器学习?
—它将如何影响SEO?
机器学习本质上是利用算法来计算基于历史数据的特定事物的趋势、价值或其他特征。
Google甚至宣称自己是一家机器学习型公司。
如果你想了解更多关于这项技术的战术方面的知识,Eric Enge在Moz上写了一篇很棒的文章,解释了机器学习如何从数学的角度来影响SEO。
搜索引擎总是喜欢尝试如何使用这种不断发展的技术,但我们知道他们目前正在使用机器学习的九种方式,以及它与SEO或数字营销的关系。
1.模式检测
搜索引擎正在使用机器学习模式检测,以帮助识别垃圾邮件或重复内容。他们插入了低质量内容的共同属性,比如:
—存在几个到不相关页面的出站链接。
—大量使用停止词或同义词。
—其他这样的变量。
能够检测到这些模式,极大地减少了对人力的投入。
尽管仍然存在着高质量的评估者,但机器学习已经帮助Google自动筛选页面来清除低质量的页面,而不需要人们先看它。
机器学习是一项不断发展的技术,因此分析的页面越多,它就越准确(理论上)。
2.识别新信号
根据2016年Google的Gary Illyes的播客,RankBrain不仅可以帮助识别查询模式,还可以帮助搜索引擎识别可能的新排名信号。
这些信号受到追捧,因此Google可以继续提高搜索查询结果的质量。
Illyes在播客节目中也提到,Google的更多信号可能会成为基于机器学习的信号。
由于搜索引擎能够教授技术如何独立运行预测和数据,因此可以减少体力劳动,员工可以转向其他机器不能做的事情,比如创新或以人为中心的项目。
3.它作为一个小部分被加权
然而,尽管机器学习正在慢慢改变搜索引擎查找和排名网站的方式,但这并不意味着它对我们的SERP产生重大影响(目前)。
在同一个播客采访中,Illyes表示,这只是他们整体排名信号平台的一部分,并且被加权为整体算法的一小部分。
Google的最终目标是利用技术为用户提供更好的体验。他们不想让整个过程自动化,否则这就意味着用户没有他们想要的体验。
所以,不要认为机器学习将很快取代所有搜索排名; 它只是搜索引擎实施的一小部分而已,它希望使我们的生活更容易。
4.基于特定查询的自定义信号
根据华盛顿大学2017年7月的一项研究,搜索引擎中的机器学习可能因查询类别或措辞而有所不同。
研究人员使用俄语搜索引擎Yandex来对不同的搜索结果进行分析。他们发现显示的结果类型主要取决于查询类别或措辞。
这意味着机器学习可以在某些特定的查询中对变量施加更多的权重。
总的来说,通过机器学习定制的个性化搜索将结果的点击率(CTR)提高了10%。
随着用户对Yandex输入更多查询时,发现CTR继续增加。
这可能是因为搜索引擎正在“了解”特定用户的偏好,并且可以基于过去的查询来提供最有趣的信息。
会议演示中经常使用的一个例子是一次查询中的一串查询,以及结果如何根据上次搜索的内容而变化。
例如,如果我在隐身浏览器中搜索“纽约足球场”,我就得到了“MetLife Stadium”的答案。
接下来,如果我在同一个浏览器中搜索“jet”,Google假设因为我的最后一个查询是关于一个足球场的,那么这个查询也是关于足球的。
当我继续搜索时,Google知道我什么时候变成了别的东西。
在同一个浏览器中搜索“美洲虎”将会带来关于美国国家橄榄球联盟(NFL)球队Jacksonville美洲豹的信息(与我最近两次的搜索有关)。
但是,我在搜索“圣地亚哥附近的动物园”的实例,然后在查询框中又开始输入“Zoo”, Google建议“美洲虎动物园”,尽管我没有再次搜索美洲虎。
搜索历史只是机器学习用来提供更好结果的搜索体验的一个组成部分。
5.图片搜索,以了解照片
早在2013年,据报道,Flickr用户每天上传140万张照片,4000万张上传至Instagram, Facebook用户上传3.5亿张照片。
虽然这些统计数据可能已经上升(很难找到更多最近的数据),但它显示了需要在web daily上编目和分析的照片数量。
此任务非常适合机器学习,因为它可以分析颜色和形状模式,并将其与任何现有的有关照片的模式数据配对,以帮助搜索引擎了解图像的实际内容。
这就是Google不仅能够为Google图像搜索结果提供目录图像,还能提供允许用户通过照片文件进行搜索的功能(而不是文本查询)。
然后,用户可以在线查找照片的其他实例,也可以找到与照片中主题相同或颜色相同的照片,以及照片中受试者的信息,就像经典圣诞电影的例子:
用户与这些结果交互的方式可以在未来塑造他们的SERP。
6.识别搜索查询中的单词之间的相似性
机器学习不仅可以使用查询数据来识别和个性化用户的后续查询,而且它还有助于创建数据模式,从而形成其他用户所得到的搜索结果。
Google趋势是一个很好的正面例子。一个短语或词最初并不意味着任何东西(例如:“planking”或“it 's lit”)可能会产生无意义的搜索结果。
然而,随着时间的推移,它的措辞越来越多,机器学习能够显示出更准确的信息。
随着语言的发展和变化,机器能够更好地预测我们说的话背后的含义,并为我们提供更好的信息。
7.提高广告质量并为用户定位
根据Google美国专利US20070156887和US9773256的广告质量,机器学习可以用来改进“其他弱的统计模型”。
这意味着广告排名可以受到机器学习系统的影响。
“出价金额,你拍卖时间的广告质量(包括预期的点击率,广告相关性和登陆页面体验),广告等级的阈值,人员搜索的上下文”通过关键字逐字输入系统,以确定Google为每个关键字考虑的阈值。
8.同义词识别
当你看到在代码片段中不包含关键字的搜索结果时,可能是由于Google使用RankBrain来识别同义词。
当你在攻读博士学位时,你会看到各种各样的“医生”或“博士”的结果,因为它们在许多程度上是可以互换的。
Google甚至在某些情况下突出了同义词,这次是“博士学位”,进一步表明它正在识别同义词。
9.查询澄清
我最喜欢的主题之一是搜索查询用户意图。
用户可能正在搜索购买(交易)、研究(信息),或者寻找任何给定搜索的资源(导航)。此外,一个关键字可能对其中一个或任何这些意图有用。
通过分析点击模式和用户使用的内容类型(例如按内容类型选择点击率),搜索引擎可以利用机器学习来确定意图。
在Google搜索中查询“best college”可以看到一个例子。结果是一份SERP的评论和大学名单,其中大学排在最前面。
总结
虽然机器学习不是(也可能永远不会)很完美,但人类与之互动的越多,它就会变得越准确、越“聪明”。
这可能会让一些人感到担忧——从《终结者》的电影中带来天网的景象——然而,当我们需要的时候,实际的结果可能是一种更好的技术体验,给我们提供我们需要的信息和服务。