学校强制采集学生录音训练AI?给钱也不行
转自公众号“四环青年”,作者布丁。
学校强制采集学生语音,只为给企业训练AI大模型用?
据经视直播消息,近日有湖北网友反映称,学校以“校企融合实训项目”为名,强制要求学生录制语音,供安徽一家科技企业用于训练语音大模型产品。涉事企业对此回应称,此前确曾与部分学校达成合作并支付费用,但需严格遵循用户自愿原则。
从该网友提供的《声音采集安全声明》看,合作内容涉及“声音采集+标注”,采集的声音将用于训练声线、语音合成及语音变声模型,并用于企业全线产品功能中。相关文档还要求录制者谈论日常生活、工作学习等内容,且严禁念稿、硬聊或尬聊。
声音属于个人生物信息,企业这么做法律层面站得住脚吗?一纸声明,是否能确保采集到的语音不会被滥用?
《个人信息保护法》明确,“处理个人信息应当遵循合法、正当、必要和诚信原则,具有明确、合理的目的,收集个人信息应当限于实现处理目的的最小范围。”
企业收集学生声音信息训练AI ,是否符合最小必要原则,值得商榷。
通常情况下,搜集个人信息需要征得本人同意。涉事的安徽深飞科技有限公司一名工作人员回应称,公司确实与部分学校达成付费语音采集合作,但数据采集严格遵循自愿原则,参与者可拒绝录制。
然而,按上述湖北网友的说法,学校要求他们在11月30日前完成语音采集工作,并表示完成的同学部分课程可获得平时满分奖励,未完成则“该门专业课平时成绩不合格,且此门专业课期末考试不能及格,必须重修”。
如果把采集语音和专业课成绩挂钩,这算哪门子的“自愿”?企业声明中提到,学生有权申请撤回,但如果学校强行捆绑,他们敢撤回吗?

另据大河报报道,有参与安徽深飞科技声音采集的湖北某职业学院学生小杨(化名)表示,录音内容要求为日常对话,如“好久不见”“最近在忙啥呢”等,完成录制的学生可获得1500元左右的收入,“承诺的是1条音频时长是1个小时,价格是15元,每天需要完成4条音频,完成100条能给1500元。”
录几段语音就能赚钱,对一些学生也算一笔不小的收入。可即便学校给学生钱,学生也自愿签了所谓的声明,这种集体采集学生语音的做法,也让人不安。因为学生们并不一定清楚,他们的声音会被用来做什么;若被滥用,会面临何种风险。
前段时间,有多名演员在社交平台反映称,自己的视频和语音被一些别有用心的AI企业盗用,用于直播带货等。还有配音演员发现自己“参与”了某广告配音,她怀疑自己的声音被擅自用于AI训练和使用了。
AI既然可以模仿名人,也可以模仿其他人。有专家介绍,AI“克隆”声音,主要是依靠深度学习算法,即短时间内从采集的声音样本中提取关键特征,包括频率、音色、声调、语速、情感等,将这些特征记录为数学模型,再通过算法合成。除了自动生成某人的声音,AI还能将这个人的声音与其形体、动作结合起来,伪造从事某种活动的视频。
随着技术的成熟,现在AI生成的语音已经到了真假难辨的地步。一些心术不正的人,用AI生成明星、企业家的声音牟利,或者生成他人亲属的声音用于诈骗,很多人无法分辨真假,很容易上当受骗。这样的案例,全国各地已经发生过好多起了。
回到新闻里的这家公司。官网资料显示,它的主营业务包括语音识别、语音合成、口语评测和数据服务。这些服务,大多需要大量使用人的真实语音,不断训练AI大模型才能深度展开。这也是目前AI语音服务市场,比较通行的做法。
该公司一名工作人员称,他们之前合作过的供应商,主要找的是“宝妈”或其它找居家兼职的人,给出的价格一般是几十块一小时。如果事先有明确告知采集语音的用途、取得授权,本身并无太大问题。
问题是,个人如何确保企业不会扩大用途?声音一旦泄露就无法回收,这个后果不是个人,也不是企业能承担的。
如何保护语音等个人生物信息不被滥用,相关法律法规在陆续跟进。包括《人工智能生成合成内容标识办法(征求意见稿)》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》等在内的法规,一定程度上给AI技术使用划定了红线。
不过,上述法规有的还未正式实施,有的只是宏观层面的规定。有专家建议,有关部门应细化完善相关规则,通过典型案例、司法解释等方式给予更为明确的规范指引,厘清法律法规边界。
在这之前,不应该允许这类声音采集活动进校园。学校和学生权力不对等。不排除一些校领导见钱眼开,为了一点个人利益,强制学生将声音卖给企业;所谓的“校企融合实训”,不过是变相盘剥学生。事后要追责违规的校领导容易,但要确保学生的生物信息不被泄露和滥用,就难了。






