绝密:百度搜索结果关键词排序算法大解密

  • 1,469 views
  • 阅读模式

福州虎纠seo和大家一起探讨当用户使用百度搜索引擎查询关键词的时候,百度如何把结果序列 展现给用户。

百度搜索结果关键词排序

百度搜索结果关键词排序

一、特征词库的类别的建立与更新
众所周知,百度有特征词库,通过特征词库,可以对用户查询序列,进行判断。例 如:当用户搜索''天龙八部在线观看〃、“射雕英雄传在线观看〃、“鹿鼎记在线观 看〃、''电视剧在线观看〃时,由于这些待挖掘序列中的 ''天龙八部〃、“射雕英 雄传〃、“鹿鼎记〃、“电视剧〃在需求特征词库中属于视频类需求的特征词,并 且 ''在线观看〃这一关键词与上述视频类需求的特征词的共现频次达到一定阈值 (共现阈值)时,根据关键词 ''在线观看〃,提取关键词 ''在线观看〃与视频需求 类别的映射关系,并根据映射关系来建立或更新需求特征词库。

二、对词条的分类

1、对查询序列进行切词处理获得切分后的词条,再通过诸如对词条进行语义分析 或根据词条在需求特征词库中进行匹配查询等方式,来获得所述候选需求类别。

例 如:用户的查询序列为''土豆上的热门影视剧〃时,通过对其进行切词处理,得 到''土豆/热门/影视剧〃,由于影视剧一词具有明显的需求类别,诸如视频、下 载、图片、演员介绍,再通过诸如对词条进行语义分析或根据所述词条在需求特 征词库中进行匹配查询等方式,来获得候选需求类别。

2、当挖掘序列相对应的分类结果的用户累计点击次数超过预设点击阈值时,基于所述 分类结果所对应的需求类别,提取待挖掘序列与需求类别的映射关系,并根据映 射关系来建立或更新需求特征词库。

例如:当待挖掘序列为''日本地震〃时,根据 该待挖掘序列对应的分类结果,如视频类搜索结果、新闻类搜索结果、图片类搜 索结果,若视频类搜索结果对应的用户累计点击次数为300,新闻类搜索结果对 应的用户累计点击次数为25000,图片类搜索结果对应的用户累计点击次数为 700,预设点击阈值为10000时,将待挖掘序列对应的分类结果的用户累计点击 次数与预设点击阈值进行比较,并根据高于所述预设点击阈值的分类结果所对应的 需求类别,即新闻需求类别,提取该待挖掘序列与新闻需求类别间的所述映射关系,并根据映射关系来建立或更新需求特征词库。

三、获取需求度

1、获取与用户的查询序列相对应的原始搜索结果

2、获取与查询序列相对应的候选需求类别

对原始搜索结果进行处理,根据查询序列,通过诸如对查询序列进行语义分析或根 据查询序列在需求特征词库中进行匹配查询等方式,来获得候选需求类别。例如, 当用户的查询序列为''土豆上的热门影视剧〃时,通过对其进行切词处理,得到 ''土豆/热门/影视剧〃,由于影视剧一词具有明显的需求类别,诸如视频、下 载、图片、演员介绍,对该查询序列进行语义分析或在需求特征词库中进行匹配。

查询,来获得候选需求类别,例如根据 ''影视剧〃可知该查询序列对应的候选需 求类别包括视频、下载、图片、演员介绍。

3、根据查询序列与候选需求类别,确定与查询序列相对应的类别需求度。

根据查询序列和候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进 行统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定所述查 询序列对于每一候选需求类别的类别需求度。

例如:“XX影视明星〃时,根据查 询序列,得到候选需求类别包括视频、新闻、背景介绍、音乐、图片,然后根 据查询序列和候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行 统计分析或者对关于搜索结果的历史点击记录按类别进行统计分析,确定与所述查 询序列相对应的类别需求度,如,“XX影视明星〃查询序列在视频类的类别需求 度为0.3 ;查询序列在新闻类的类别需求度为0.3 ;查询序列在背景介绍类的 类别需求度为0.1 ;查询序列在音乐类的类别需求度为0.2 ;以及查询序列在 图片类的类别需求度为0.1。

需求度确定:

用户的查询序列为“XX影视明星〃,将查询序列在需求特征词库中进行匹配查询, 当在需求特征词库中匹配查询到XX影视明星属于明星列表并且该明星列表对应 的需求类别包括视频、新闻、背景介绍、音乐和图片时,得到与查询序列相对应 的候选需求类别包括视频、新闻、背景介绍、音乐和图片。结合该查询序列相应 的大量用户的点击统计分析。

例如:统计分析结果中表明视频类搜索结果、新闻类 搜索结果、背景介绍类搜索结果、音乐类搜索结果与图片类搜索结果的用户点击 频次分别为60000次、10000次、10000次、10000次和10000次,则查 询序列对于视频类搜索结果的类别需求度为0.6,而对于图片类搜索结果的类别需 求度为0.1。

4、根据类别需求度,将搜索结果提供给用户。

根据所述类别需求度,将搜索结果提供给所述用户。还是以“XX影视明星〃为例: 当用户的查询序列为“XX影视明星〃时,查询序列在视频类的类别需求度为0.3, 在新闻类的类别需求度为0.3,在背景介绍类的类别需求度为0.1,在音乐类的类 别需求度为0.2,在图片类的类别需求度为0.1时,若查询序列的搜索结果列表中 的第一页显示10条搜索结果,根据类别需求度,将3条视频类的搜索结果、3 条新闻类的搜索结果、1条背景介绍类的搜索结果、2条音乐类的搜索结果提供 给用户,并且将剩余的所有搜索结果中与查询序列相关度最高的1条搜索结果在 第一页提供给用户。

根据类别需求度,将类别需求度与搜索结果提供给用户。具体地,根据查询序列与 候选需求类别,通过诸如对该查询序列所对应的搜索结果按类别进行统计分析或者 对关于搜索结果的历史点击记录按类别进行统计分析,确定了与查询序列相对应的 类别需求度后,以诸如特别字体、浮动窗口等方式,将搜索结果相对应的类别需求度与搜索结果提供给所述用户。百度己使用此类 技术,可在百度搜索结果页面中找找。

百度对结果的优选

1、查询相关属性包括以下至少任一项;

2、搜索结果与所述查询序列的相关度;

3、搜索结果的权威度;

4、搜索结果的时效性。

相关度:

优选结果不仅根据搜索结果所对应的类别需求度,而且还结合搜索结果与 查询序列之间的相关度,将搜索结果提供给对应的用户。当搜索结果所对应的新闻 类搜索结果的类别需求度和音乐类搜索结果的类别需求度相同时,将所述搜索结果 对应的类别需求度与搜索结果和查询序列之间的相关度结合,将所述搜索结果提供 给用户。

权威度:

确定查询序列的类别需求度后,搜索结果对应的类别需求度与搜索结果的 权威度结合提供给用户,例如:查询序列对应的新闻类搜索结果的权威度较高而查 询序列对应的音乐类搜索结果的权威度较低时,将查询序列对应的新闻类搜索结果 和音乐类搜索结果依次提供给所述用户对应的用户。

时效性:

不仅根据搜索结果所对应的类别需求度,而且还结合搜索结果的时效性, 将搜索结果提供给用户。例如:查询序列对应的新闻类搜索结果的时效性较强而查 询序列对应的音乐类搜索结果的时效性较弱时,将查询序列对应的新闻类搜索结果 和音乐类搜索结果依次提供给用户对应的用户。

一、    相关度

1、网站内容是否和网站主题相关。

可以方便搜索引擎把你网站进行定位,方便对你网站进行类目分类。准确的类目分 类对提升网站在某一个行业中的权威度有很大的好处。

2、网站中的内容是否能够满足用户需求。

这个讨论的太多了。就不一一详解。网站中的内容相关性是影响seo排名的主要因素之一。

二、权威度

权威不等于知名,知名反作用于权威。权威度的计算方法比较复杂,有很多的基数作为参考,以下列出''可能"决定权威度 的一部分基数。

1、网站品牌词的搜索量。

2、与网站相关的长尾词的流量。

3、直接访问流量。

4、url中的体现的权威度(在索引库中存在的时间,在搜索中的表现,政府网站等)。

5、口碑与社交媒体的转载。搜索引擎一直在监控网络上用户的一举一动。不过因为 一些''原因〃有些是直接效果,有些是间接效果,或者没效果。不过所有可以点击的link都是有用的。

6、网站更新频率。嘿〜!这个网站还有人维护呢。不是死站。短期内不维护(春节 放假7天)影响不大。当长时间不维护。真的可能会降权。

7、页面代码的规范化。虽然现在己经过了扣细节的时代,但是搜索引擎还是通过源 代码来获取页面信息。适当的减噪,可以让搜索引擎更方便的判断主体内容,主题, 页面结构等。

8、所有元标签内容的质量与相关度。tkd的重要性不用说了。

9、外部投票:百度的外部链接算法,最近看了个百度的文章,貌似是:把网站所有 的有外链的页面建成一个合集,把其他一些结构相似的页面建立一个合集,通过合 集之间的互换外部投票的权重,得到结构相似的页面外部投票的权重,在加上内部 投票权重,等于未处理的原始页面权重。

10、    相关文章内容是否丰富。(文章数量,质量,配图情况等)网站中的权威度现在是影响百度排名的最重要的因素之一。

三、时效性

多见于时效性很强的内容。如:mh370飞机失事前,排名在mh370搜索结果页面 的主要为mh370飞机的订票,介绍等信息。当飞机失事后,随着新闻类目需求的增 加,搜索结果页面也随之进行了变化。

排序并不是以先来后到为准,在文章时效性很强的时候,彳艮''短"的一段时间内出现 大量类似文章,点击率达到一定厥值,搜索引擎结合相关度,权威度等一系列的算 法,向搜索用户推荐相关索引序列。

我们都知道只有title中包含关键词组才有可能在搜索引擎中有这个词的排序,但随 着百度对自身的用户体验的发展,从百度排名算法发展上看,关键词位置决定排名- 关键词完全匹配优势-关键词分词结果进入排名-根据关键词用户体验进行排名排序 等一些列算法的改变,百度对于搜索结果序列是否能够满足用户需求,一直都在尝 试。随着百度的尝试,Seo也从体力活慢慢的向智慧型转变。

那么我们分析下百度排序是如何提升自己的用户体验的。

百度有搜索日志,监控每个用户的搜索习惯,通过搜索日志,可以把很多关键词联 系起来。

1、通过搜索日志,可以产生泛需求词,涵盖几乎所有的有需求的词。

⑴通过模式词表对词语进行选取或者数据挖掘的方式得到,模式词表中的词
包括起修饰作用的形容词,例如''好玩的〃、“好看的〃、“聪明的〃等等。搜索日志记录 了一个以上用户的搜索行为,包括用户搜索时使用的关键词,因此,通过模式词表, 可以从搜索日志中提取出一个以上前缀匹配的关键词,例如 ''好玩的地方〃、''好 看的电影〃等等,这些前缀与模式词表中的词匹配的关键词均可作为泛需求词。

⑵从搜索日志中提取以预设的模式词表中的词为前缀的关键词,并将提取的关键词去除前缀后的剩余部分作为泛需求词。例如以模式词表中的词为前缀的关键 词有''好看的电影〃、''好玩的地方〃,其中 ''好看的〃、“好玩的〃,是前缀则 ''电 影"、“地方〃就是泛需求词。

⑶确定搜索日志中各关键词的后继词,并将属于同一实体类别的后继词所占 比例超过第一设定阈值的关键词作为泛需求词,其中一个关键词的后继词是与该关 键词共同出现在一个会话中且在该关键词之后出现的词语。

通过泛需求词,可以提取到相对应的精确需求词与后续词。例如:泛需求词(电影),通过 搜索日志,我们得到精确需求词(电影天堂,电影下载,电影排行榜,电影网)同时也得到 了电影的后续词(速度与激情,战狼,奔跑吧兄弟等)在这里先不讨论后续词,虽然广泛应 用在右侧相关展示、大家都在搜、阿拉丁。我们单单说说精确需求词。

福州seo:无论百度怎么变换算法,站长们还是要追随着他,做好关键词词性分析,排名稳增不降。

weinxin
虎纠自媒体官方微信
这是我的微信扫一扫
f9seo
  • 本文由 发表于 2016年7月16日14:59:21
  • 转载请务必保留本文链接:https://www.f9seo.com/post-532.html
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定