欧盟要求开放一部分搜索数据,谷歌这次是真怕了

文/刀客doc(头条精选作者)

谷歌这次真的紧张了。

一个月前,欧盟委员会给谷歌列出了一份要求:搜索市场长期由谷歌一家主导,后来者很难获得公平竞争机会。

欧盟认为,按照《数字市场法》,谷歌既然已经是守门人,就不能只把搜索市场的大门握在自己手里。它需要向其他搜索引擎开放一部分搜索数据,包括排名、查询、点击和浏览数据,让竞争对手也有机会改进自己的服务。

昨天,谷歌的回应来了,就是俩字:不行。

谷歌的姿态罕见强硬。

据路透社报道,谷歌科学家谢尔盖·瓦西尔维茨基向欧盟反垄断监管机构发出警告:如果欧盟要求谷歌向 OpenAI 等竞争对手开放搜索引擎数据,欧洲用户的隐私可能会被暴露。

瓦西尔维茨基自 2012 年起担任谷歌科学家,是谷歌内部长期研究搜索、算法和数据安全的核心人物。他将会见欧盟反垄断官员,提出一套范围更广、保护措施更完善的替代方案。

过去很多年,人们谈到谷歌的强大,习惯把原因归结它强大的数据和技术。

不过,谷歌还有一个更容易被低估的资产:信号。

怎么理解呢?

比方说,一个人搜索了“北京到上海机票”,这是搜索数据。他在页面停留了多久、有没有返回、有没有继续搜索“上海酒店”“虹桥机场到市区”,这些是行为数据。

但谷歌真正关心的是透过这些孤立的记录,看到这个人是不是已经进入了明确的出行决策?是在随便看看,还是已经接近购买?

数据是行为留下来的客观记录,信号可以推测用户的主观意图。

进入AI时代,数据的边际价值开始下降。因为很多平台都有数据,很多公司也可以购买数据、抓取内容、训练模型。真正拉开差距的,是谁能从这些数据里判断用户的真实需求。

同样是搜索“北京到上海机票”,有人只是查价格,有人准备马上出行,有人在做差旅报销,有人在比较高铁和飞机。

数据表面上相似,背后的意图完全不同。

AI系统的价值,就在于把这些相似行为拆开,判断谁只是浏览,谁正在犹豫,谁已经接近交易。

所以AI时代,平台的核心能力会从拥有数据,转向理解意图。

数据仍然重要,不过意图识别才是把原材料变成商业判断、推荐结果和广告定价的过程。

意图识别这种能力并非简单的数据规模问题。

竞争对手可以抓取网页,可以训练大模型,可以买浏览器入口,也可以做一个看起来体验不错的新搜索框。但它很难复制谷歌几十年来积累的用户反馈回路。

因为网页内容是公开的,用户行为反馈不是公开的。

搜索结果可以被模仿,搜索过程中的意图变化很难被模仿。

页面可以被抓取,几十亿人每天如何点击、停留、返回、换词、再搜索的经验,无法凭空生成。

这也是谷歌搜索的一大护城河。

这套判断一旦进入广告系统,就会变成更高的转化率、更精准的竞价、更好的排序质量,也会变成广告主愿意为谷歌支付溢价的理由。

谷歌最不害怕的是罚款。毕竟是财大气粗。过去十多年,它在欧洲已经吃过很多反垄断罚单,金额很大,但对一家年收入数千亿美元、现金流极强的公司来说,罚款更多是成本项,谷歌也已经习惯了。

谷歌也不一定最怕业务的拆分。拆分当然会带来资本市场和组织上的巨大冲击,但那是一个漫长、复杂、充满司法拉扯的过程,真正落地并不容易。

但这次欧盟的要求,谷歌可能真的紧张了。

因为触碰了谷歌最核心的一层资产:谷歌如何通过长期用户行为反馈,判断意图、衡量搜索质量、训练排序系统、优化广告匹配。

为什么这件事在今天突然变得更重要?

因为 AI 搜索来了。

以前搜索引擎之间竞争,大家比的是索引规模、排序算法、网页质量、入口分发。

现在呢?

OpenAI、Perplexity、微软 Copilot、未来各类智能体,都想把用户从传统搜索框里拽出来。

谷歌的传统搜索形态确实收到了不小的挑战。

但往底下看,AI 搜索还是绕不开一个问题:它怎么知道自己的答案是对的?怎么判断一个问题背后是知识需求、消费需求、医疗需求,还是交易需求?

大模型可以生成漂亮的话,但真实用户行为会告诉系统,哪些话有用,哪些话只是看起来有用。

如果 OpenAI 只是做一个聊天框,谷歌可以用 Gemini、Chrome、Android、默认搜索入口去对抗。

如果 OpenAI 未来能合法拿到一部分谷歌搜索行为数据呢?

事情就变了。

AI 搜索公司可以用这些数据改进检索、训练排序、校准答案、判断商业意图。它们会更快接近谷歌过去几十年积累出来的搜索经验。

谷歌当然不愿意。

这就像一个老厨师开了几十年饭馆,靠每天观察客人点什么、剩什么、回来几次、抱怨什么,终于形成了一套自己的味觉判断。现在监管者说,你太强了,把这些客人的反馈数据拿出来,给隔壁新开的饭馆也用一下。

老厨师一定会急。

谷歌这次把隐私作为挡箭牌,是一步很聪明的棋。

在欧洲的监管框架里,隐私和反垄断是最大的两个议题。

欧盟这些年一边搞 GDPR,一边搞 DMA。前者强调保护个人数据,后者强调打开平台竞争。平时这两个目标可以并行,到了搜索数据这里,就开始互相打架。

欧盟想让谷歌开放数据,扶持竞争对手。

谷歌反过来问欧盟:你要公平竞争,还是要个人隐私?

这个问题很难回答。

搜索数据跟普通广告曝光数据不一样。

一个人的搜索框,往往更接近个人的隐私。

比如一个人可能不会在社交平台公开说自己生病了,但会搜索一些症状的关键词。

他可能不会公开说自己想离婚,但会搜索财产分割。

即使拿掉姓名、账号、IP 地址,只要保留查询词、点击、时间、地理、浏览路径,仍然可能拼出一个人的基本画像。

尤其到了 AI 时代,重识别能力更强。

过去要重新识别一个匿名用户,需要人工推断,需要外部数据库,需要统计模型。

现在大模型可以处理长文本、长序列、复杂语义,能把很多零散线索串起来。

一个人连续搜索罕见病、某小区附近医院、某个公司岗位、某条航班、某个孩子学校活动。这些单点都匿名,连起来就可能成为身份指纹。

谷歌称,自己的红队两个小时内重新识别用户,具体测试细节我们没有看到,不能完全照单全收。但它指出的风险是真实存在的。

这就是欧盟两难的地方。

欧盟当然也不是闲着没事找谷歌麻烦。

它一直想解决一个问题:搜索市场为什么这么多年没有真正竞争?

微软投了很多钱,Bing 仍然很难撼动谷歌。

DuckDuckGo有隐私标签,但规模有限。

Brave、Neeva、You.com、Perplexity 都有新想法,但很难突破主流用户习惯。

原因在于搜索市场有很强的飞轮效应。

用户越多,数据越多,进而结果越准,进而又用户越多。

广告主跟着用户走,收入越高,研发和分发投入越大。

最后形成一个越来越正向的价值循环。

如果只要求谷歌给用户一个选择屏,让大家自己选搜索引擎,意义不大。大多数用户懒得换,换了也可能发现新搜索不够好,再换回谷歌。

如果只罚谷歌几十亿欧元,谷歌也能承受。

罚款对它来说是痛点,但不是命门。

在欧盟看来,真正能改变竞争态势的办法,就是拆掉谷歌的一部分数据飞轮。

欧盟的态度是:你谷歌作为守门人,不能把用户行为反馈全部锁在自己系统里,因为这些数据已经影响了整个搜索市场的竞争能力。

这个逻辑很激进的。

一旦成立,未来不只搜索数据可能被要求开放。

地图数据、购物数据、视频观看数据、广告点击数据、应用商店数据,都可能被竞争对手用类似理由要求打开。

尤其是当下的AI公司。

OpenAI 要做搜索,不能只靠模型聪明。

需要知道用户对答案的真实反应,需要知道商业查询怎么变现,需要知道哪些内容只是噪音。

如果能拿到谷歌的一部分搜索数据,ChatGPT在广告业务上的追赶速度会快很多。尽管他的布局速度以及很快了。

谷歌搜索广告的估值,长期建立在几个假设上:

第一,搜索仍然是最高意图入口。

第二,谷歌长期控制这个入口。

第三,竞争对手很难复制搜索质量。

搜索数据的开放会改变投资者对 Alphabet 的长期想象。

罚款不可怕。

合规成本也不可怕。

可怕的是监管者开始把谷歌内部数据资产,重新定义为市场竞争所需的公共基础设施。

如果这个趋势扩大,谷歌的护城河会被一点点稀释。

当然我觉得,最后方案大概率会折中。

欧盟不会轻易放弃数据共享,因为 DMA 已经把方向定下来了。

谷歌也很难完全挡住,因为它已经被定义为守门人。

如果欧盟最后给的是高度聚合、强延迟、低粒度数据,再配上严格沙盒和审计机制,这件事的象征意义会大于实际意义。

竞争对手会说自己赢了,谷歌会说自己服从监管,市场格局不会立刻变化。

如果欧盟最后要求较高粒度、较高频率、较低价格的数据共享,那就不一样了。

AI 搜索公司会真正拿到可用燃料,谷歌搜索经验会部分外溢,长期护城河会受到实质冲击。

所以这件事,要看数据开放到什么程度。数据这种东西,差一层粒度,价值差十倍。(作者:刀客doc)

站务

最近更新的专栏

全部专栏