百度百科陷"词条维权”困局:个人隐私、错误信息如何止?
"证明我是我"——这个曾在行政审批中饱受诟病的悖论,正在互联网知识平台重演。
上海杨浦的朱先生近日发现,百度百科上关于自己的词条不仅存在事实性错误,更在修正过程中陷入隐私让渡与程序困局。
当知识共享平台异化为个人信息"失控区",其背后折射的是否是平台机制的缺陷?
未经授权建立个人词条还出现事实错误
开放编辑与责任缺失的双重困境
根据正在新闻报道,近日,上海杨浦。朱先生在查询资料时发现个人信息被他人编辑并上传至百度百科,该百科内容与实际不符,信息有误。
截图自正在新闻
6月5日,朱先生告诉《正在新闻》,百度百科上对他的信息阐释跟事实相差甚远,比如他在浙大研究领域是石器微痕,并不是陶瓷,同时在研究成果这部分,自己并不是首次将支钉间隔具作为核心研究工具,编辑的十分不严谨。
朱先生尝试修正自己的词条,选择了“本人编辑”的方法。最开始朱先生提供了自己的毕业证,随后又被要求其他证明材料,到最后甚至要求朱先生人脸识别。朱先生表示,连支付软件都未开启人脸识别,百度凭什么要求他人脸识别才可以编辑这些错误的材料。
同时,朱先生表示,如果要建立个人百科词条,要么是当事人本人来编辑,要么是公众人物由他人编辑。百度百科未经授权建立个人词条还出现了事实错误,对自己造成了困扰;更正错误信息时还索要多个材料,侵犯自己的隐私权。朱先生认为百度没有权力也没有理由来做这些事情。
6月6日,百度百科客服对朱先生表示,删除词条流程繁琐是因为担心有人恶性删除,刷脸的环节已经反馈给技术人员,如果目前词条内容对朱先生造成困扰,需要删除的话,将转至侵权组同事做备案,协助处理。
事实上,快消前瞻在社交平台检索发现,不少网友也遇到过类似问题。
在小红书平台,有网友称“百度词条侵犯隐私,删除困难重重”,表示自己莫名其妙在百度百科有不符合自己信息的词条,申请删除不仅需要身份证正反面、还需要手写保证函和人脸识别认证来“证明我是我”。该网友认为自己的个人隐私和信息权利受到侵害,随后该网友向当地12345进行了相关投诉,但并未有何进展。
截图自小红书平台
在该帖子下面,同样有网友表示自己也是“删除无门”,认为“创建词条的人能够胡言乱语,本人想删却受阻”。
在黑猫投诉平台,也有网友投诉称,自己在多年前曾经在一家公司工作,为了帮助该企业,义务免费进行宣传编写了词条。然而多次申请删除条该词条,百度百科的工作人员总是以各种理由拒绝删除,该网友表示自己早就从那家工作单位辞职,而且由于自己目前在新的单位工作,已经严重影响了个人生活以及工作。
除此之外,还有网友投诉百度百科“涉嫌上架虚假词条,侵犯品牌权益”,该网友表示自己公司旗下持有商标证书的品牌标识,在百度百科词条显示却是其它公司,且无商标证书。该网友称其公司曾多次申请修改词条,均不予以通过,百度百科给出的理由是证据不足。该网友表示对方没有证据基础,为何可以登上百科词条。
AI污染下知识库的“递归危机”
如何保证百科的权威?
根据公开资料,百度百科,是百度在2006年4月20日推出第三个基于搜索平台建立的社区类产品,这是继百度贴吧、百度知道之后,百度再度深化其知识搜索体系。
2007年1月10日,百科首页第一次改版。新增百科任务、百科之星、上周贡献榜等栏目。
2007年4月2日,百科蝌蚪团正式成立,4月10日,百科蝌蚪团第一批成员出现,4月26日蝌蚪团首页上线。
2007年4月19日,词条页面改版,改良词条页面的行高和行宽,在词条页面的底部增加了汉英词典解释,改进历史版本页面。
2007年5月百科编辑词条积分调整;6月开放分类检索升级,历史版本增加翻页功能,百科优质版本标准出台;9月高级编辑器上线,百科任务改版。11月百科推出相关词条,可以在百度知道里搜索到百科词条。
根据百度百科官网显示,截至快消前瞻发稿前(2025年6月7日)百度百科已经收录了29029332个词条,编辑次数超2.6亿次,参与词条编辑的网友超过799万人,几乎涵盖了所有已知的知识领域。
截图自百度百科官网
快消前瞻通过体验百度百科进行词条创建,发现可以创建的词条主题包括人物、产品品牌、医疗、企业类等内容,创建词条也明确要求“不许添加广告性质”“不编写虚假、捏造、恶搞、缺乏依据的内容”,明确规定了不能侵犯他人合理权益。
截图自百度百科官网
但值得注意的是,社交媒体上,不少网友表示百度百科词条上存在信息“错误”。
截图自小红书平台
除此之外,随着AI时代的来临,不少用户反映百度百科词条中出现了大量AI生成的内容,导致许多基础词条出现了事实性错误。
根据公开信息,最常见的百科语料库包括维基百科和百度百科,它们以免费、开源、多语言支持和高文本价值为特点。这些知识经过人工精心整理,准确性较高,能够帮助模型建立对各类事物的基本认知,如历史事件、科学概念等。
由于这些百科内容易于获取,不少人工智能机构通常会选择特定语言的百科数据进行爬取和过滤,作为预训练语料库的一部分。因此,它们在预训练语料库中的出现频率较高,是大语言模型(LLMs)知识库的基础。
然而,随着AI大模型将百科作为核心语料,错误信息正通过"递归效应"加速扩散。
中国人民大学新闻学院教授刘海龙在接受市象的采访中指出,“未来我们得到的内容可能是AI生产的东西占主导,这些东西又成为新的语料喂给AI,然后AI又会加工AI生产的东西,不断反复。这就会出现‘递归效应’,出现尼采讲的‘永恒循环’。”
AI带来的信息传播负面效应日益显现。这一现象并非难以察觉,越来越多的人已开始感受到AI对信息传播的颠覆性影响。
根据环球网报道,目前,维基百科为应对人工智能生成内容带来的挑战,推出了维基人工智能清理项目(WikiProject AI Cleanup),并强调内容的可验证性:要求编辑在文章历史中注明是否使用了大型语言模型(LLM)。
知识平台的权威,永远建立在真实性与信任的基石之上。
百度百科作为中文互联网的重要知识库,其权威性的确立不仅关系到用户信任,也影响到整个信息传播的生态。未来,百度百科更需要一个尊重个体权利、敬畏知识真实性的解决方案。