如何使自己发布的信息快出现在百度首页?事实上,搜索引擎结果的呈现取决于一系列复杂的算法和排序规则,而不仅仅是“新发布的内容”。

我们先来了解一下,百度首页上的搜索结果通常由哪些信息组成:

1百度付费广告(竞价排名推广/展示广告)

2百度免费产品:百科全书、信息流(百度原创新闻)、熊掌、百佳、知音、贴吧、百度、地图、图片、视频、音乐、电子商务聚合等

3社交网站的UGC内容,收录微博、问答网站(智狐)、论坛、博客、视频网站等

4电子商务购物网站(含OTA在线旅游预订)

除了PC和移动搜索在设备和显示形式上的差异外,前几类内容会依次占据PC+移动主页的搜索结果,排序也不会有太大的本质区别。除了百度付费广告及其产品外,自然搜索结果排名主要受以下因素影响:

首先,搜索引擎需要确保呈现结果与用户的搜索需求密切相关,其中相关性收录关键字在网页中出现的位置和频率(密度)。

对于构成绝大多数自然搜索结果的信息内容,关键词在主副标题、_段和正文中的位置和频率(合理)将直接影响到搜索引擎的相关性评价。在百度成立初期,内容和用户相关性对搜索排名的影响将占70%。

以沃尔玛新闻稿为例,核心关键词“沃尔玛”和“陈文元”分别出现在标题和_段中6次和3次。在搜索结果中,会向用户推荐更多相关页面。

作为互联网动态更新的及时性内容来源,搜索引擎将赋予新闻网站更高的权重。如果内容包含更具体的时点信息(如新闻发生的具体时间),则更容易被搜索引擎捕捉为新鲜及时的内容,然后综合其他(以下)指标来确定索引和推荐。

如果内容接近热点,在百度新闻和页面时效卡上显示的机会就越大。2017年3月百度宣布取消新闻源数据库时,其公告中强调的核心来源是“及时性内容识别技术”的升级。

所谓内容质量,即内容能够为用户产生的价值。在过去的一年里,一个非常明显的趋势是,百度正在过滤掉网页和新闻的搜索结果,或者被算法判断为营销内容的结果。即使在内容发布门户上,热门搜索结果也不会推荐它。

百度站方面曾在接受界面采访时表示,“我们有一个部门半年来一直在调整算法,对于所有百度抓取的网页,教机器判断时效性和内容质量,在前端显示时,有的软文本会被过滤掉,有的不会有太大变化。”。

所谓用户参与,是指用户参与的行为,收录阅读、点击、评论等。这些指标也是百度信息指数的基础。用户对网页内容的参与度越高,搜索引擎的重要性和普及度就越高,页面呈现给用户的机会就越多。

一般来说,社交UGC内容,如知乎、豆瓣、招聘信息、分类信息、电子商务信息、股市等,通常更新频繁,点击量大,搜索结果会更好。

人们看得越多,推荐的搜索结果就越高,用户点击越多,周期积累就越多。

除了直接搜索访问,用户还可以通过单击其他网页来访问内容。通过其他页面生成的连接越多,搜索尾部就越长。对于网站来说,内部和外部链接的数量,特别是从外部页面指向页面的锚文本的数量和质量,仍然是搜索引擎决定网页价值的指标之一。

网页质量收录内容质量、浏览体验、PC机和移动终端的访问速度、友好性以及是否能满足用户的扩展需求。除了对网站的评价外,百度逐步加强对内容质量的识别和评价,并将其纳入对内容所在登陆页面的评价中。

特别是百度取消新闻源数据库后,即使是门户网站等有名新闻源网站,同一频道不同质量的内容,对百度新闻和网页的访问也存在明显差异。软文章(非时效性新闻)被算法判定为低质量营销目的,将直接从结果中过滤或减少。

关键词竞争是容易被忽视和未知的因素,但它恰恰是影响搜索结果排名重要的隐藏因素。所谓关键词竞争,也指关键词热度,是指关键词在百度搜索热度和收录的相关页面、新闻量。

例如,用户搜索关键词的频率越高,其受欢迎程度就越高。相关网页和新闻的数量越多,竞争的程度就越大。同时,这也意味着新发布的内容越难影响百度搜索结果的排名。

关键词搜索页面包含的结果越多,关键词的有名度越高,竞争程度就越大

以近流行的“这是嘻哈”节目为例。每天,超过5万人使用百度搜索“这是嘻哈”。相关网页403万个,百度新闻12万篇。这意味着新发布的关于“这是嘻哈”的内容应该与现有的403万个网页或12万篇新闻文章进行PK。经过对算法的综合评价,它所占的优势才可以被这5万名用户在搜索中看到。

其实所谓的算法规则和索引都是参考,根本的关键是内容能真正为用户提供价值。正如百度官方在其《百度搜索引擎工作原理》中所描述的,影响搜索引擎结果排名的因素,随着算法和机器学习技术的不断发展,目前还没有确切的维度和答案。