被永远改变的搜索,被低估的百度

  最后,当社长看到正确答案还是在花了钱的数据库找到的,觉得也算是尽力了。社长的检索过程已经是一个普通网民借助手头工具,可以做到的事实核查的极限

  你可以想象,普通网民搜索内容时候,看到最上面的结果直接就采信了,这才是最可能发生的情况。

  其实,北大引用的是网络流传的“须知少时凌云志”,而原诗是“须知少日拏(ná)云志”,由此也可以推论出他们也是随意搜索一下了事,没注意到搜索结果包含“后两句”。果真如此,那它收获这一波嘲讽也就没什么冤枉的了。

  “渡河”提到,“曾许人间第一流”的考据结果,最后使用了不对外开放的付费数据库才得以实现。而原始版本的诗比较冷门,从来没在互联网上流行过,“以至于现在的人哪怕想知道原文全诗是什么,找遍互联网也只能找到一堆错误答案互相印证,真相却在背后埋没。”

  优质的搜索结果,应该以优质的内容供给作为基础。谷歌因为引用了一些国内不容易访问到的资源,所以有机会改进整体结果质量,其中贡献最大的当属引用维基百科的词条。

  人人都知道谷歌爱维基百科,但没人知道爱得有多深。2012 年一项研究显示,在当时的谷歌搜索 1000 个随机关键字,99% 的情况下,维基百科条目都会出现在结果第一页。

  谷歌因历史原因,仍保留首页搜索框的“手气不错”按钮,等同于搜索结果第一页的第一条。而毫不意外,绝大多数情况下,第一条结果也都来自维基百科。2016 年开始,谷歌与维基媒体基金会合作,改善了在搜索结果页展示维基百科词条的视图效果。

  2018 年,谷歌曾在“加州共和党”搜索结果页,展示其“意识形态”一栏为“纳粹”,但这是一个源自维基百科的错误,当时那个词条被恶意修改了。

500

  这个例子表明,我们从谷歌得到的结果好坏,不完全由谷歌的算法、广告逻辑等决定,最根本的,还是它引用了质量稍微高一些的内容。

  很多用户实际使用中体会到的“谷歌比百度更好用”,可能是一系列因素共同作用下的实际感受。一般而言,同一关键字以英文搜索,相比用中文更能找到切题的解答,比如关于编程的问题,老司机们都会推荐 Stack Overflow 而不是博客园或 CSDN。

  在搜索的时候,如果能顺畅阅读境外或者外语内容,用户会觉得是理所当然的,而不会特别多加关注。有些批评百度搜索及其用户的知乎回答,甚至从自己会英文搜索当中品出了一种优越感,十分脱离群众。

  我们应该也都能体会到,中文(特别是中国境内)互联网信息来源的质量本来就很差,充斥着大量低质、重复、垃圾的内容,而再好的算法,再“良心”的搜索引擎,也只能在这些结果当中挑选,所谓“巧妇难为无米之炊”。

  被放在聚光灯下的 Bad Case

  2018 年 6 月,有媒体报道通过搜索引擎,可以找到一些“相约自杀”的 QQ 群、微信群等,成为有些年轻人自杀的诱因。其中提到,用百度搜索“自杀群”关键字,不仅能找到群号码,还能通过联想词功能引导到更多相关内容。

  航通社当时写了一篇《如何用搜索引擎“相约自杀”》,探讨这些用户需求没有被满足、体验不好的情况是如何发生,又怎么被放大成为热点话题的。这种情况被称为“坏例”(Bad Case)。

  社长提到,搜索联想词和相关搜索一旦出现 Bad Case,有百度员工看到就会向内网报告,从而及时修复和清理不当结果。

  而发现这些 Bad Case 的过程,则是亿万网民在使用过程中充当“义务测试员”,毕竟这些真人的无穷尽的使用场景排列组合,其细致程度是怎样的企业内部测试都难以企及的。

  所以,一直被盯着的搜索引擎,出现不恰当的搜索结果,就会被媒体愤怒地质问:为什么像我们记者这样的普通用户,都能一眼就发现的东西,你们有那么高明的技术手段,却迟迟不能发现?

  在国外,谷歌搜索中出现不当结果的情况也一样频繁见诸报端。就像 @百度 官方微博一样,谷歌在 Twitter 上也有一个账号 @searchliaison,专门用来汇总用户反馈的 Bad Case 以及道歉。

500

  《如何用搜索引擎“相约自杀”》时提到,在知乎有关于百度的“经典问题”,如“百度作了哪些恶?”、“为什么有人说百度以一己之力全面降低了中国互联网体验?”等。此后同类问题逐步越来越多。

  这些问题下反应的 Bad Case 出现于不同时期,有些现在再看无法重现,另一些则很快得到了纠正。即便如此,成千上万个回答依然积累下来,也包含下面的点赞、评论等数据。在人们了解百度搜索的风评时,很少有人会逐一检验这些过去的问题是否现在还有。

  甚至可以说,更多 Bad Case 的爆出是与搜索引擎使用的频率成正相关的。使用搜狗、360、神马、必应等其他搜索出现 Bad Case,一般也不会引发网民像对百度一样那么兴致勃勃的讨论。

  以前苹果 Mac 在国内普及程度较低,当时 Windows 被舆论塑造成一款不安全的系统,而苹果 macOS 甚至被称为“不会中毒”。当然,这并不符合实际。这是跟两款系统的市场占有率,以及用户的使用习惯等因素密切相关的。

500

  搜索市场也是如此,当其他产品的低体验逐渐增多以后,用户也会慢慢改变印象。

  本文中,社长已经多次把谷歌搜索跟百度进行了并排比较。其实如果继续比较下去,还可以发现更多有趣的情况

  (1)百度的搜索广告链接只提供了很淡化的标记,不仔细看根本分不出来。

  谷歌搜索将广告结果与常规搜索结果混合的程度,比一般人想象的还要过分。这是过去十多年谷歌“赞助商链接”的展示效果变迁史:

500

  百度 2019 年初取消了搜索结果中域名的显示,改为网站小图标(favicon) + 网站名的组合。同年 10 月,谷歌搜索同样取消了搜索结果的网站 URL 展示,一群用户批评这是“反人类”的改动。

我要评论

请自觉遵守互联网相关的政策法规,共同营造“阳光、理性、平和、友善”的跟评互动环境。

全部评论 2
最热 最早 最新

站务

全部专栏