古典学习机时代结束,AI Native的学习机大幕开启

500

导语:最近半年,AI圈有三支视频很火。

2024年2月18日,Sora横空出世,将文生视频的世界打开;

2024年6月6日,快手发布了自研视频生成大模型可灵,朋友圈刷屏一片,证明了国内AI实力进阶一大步;

2024年6月末,教育圈也迎来它的Timing时刻,精准学发布首个原生代AI辅学机Bong系列,并公布了一段短短2分钟的交互视频,在教育小圈层疯狂传阅。

为什么说,这次交互创新对于整个教育行业太重要了?为什么说,精准学拉开了AI Native的学习机大幕一角?

因为,这是我们第一次看见通过人机交互,突破了「辅学」的边界。桃李财经带来独家视角解读。

文章来自公众号|桃李财经

【一】

一段短短两分钟的对话视频

辅学多模态能力已成熟

几近辗转,笔者终于拿到这个内测视频。

视频以音频对话形式展开,两人对话同时展开字幕。

内测视频:

https://weixin.qq.com/sph/A3Zf4ql1s

说实话,类似形式的小视频笔者看多了,一开始并不以为意。直到看到视频结尾,才发现竟然是一位学生跟学习机里的“老师”在真实对话,那一刻,整个人汗毛都竖起来了。

除了震惊还是震惊,AI真人交互竟然发展到这种程度了,又倒过去认真听了几遍,视频释放了两个重要信号。

1、端侧交互延迟已经可以“骗”过耳朵

小编拆解了视频中,AI接话的速度,几乎接近正常聊天,1-2s的停顿。同步对照OpenAI的视频延迟,几乎接近。

这也就意味着,AI的交互能力已经可以“骗过”人类耳朵,按照精准学AI技术负责人张宁所说:“端到端目前的语音技术延迟,达到800毫秒-1500毫秒延迟,人类神经就不会以为是AI。”

这是多模态交互能力在应用侧的一个奇点。

2、察言观色的能力,接近人类五感

除了骗过“耳朵”,AI更是有了“眼睛”和“嘴巴”。在音频里,AI不仅有自己的辅学思路,有条不紊的辅学节奏,更是拥有了“察言观色”的能力,真实感都跃出了屏幕。

AI不仅会主动开口询问你是否听懂了,还会根据你语气语调和面部表情进行综合判断你是否真的学会了,类似于“你说话的语气这么不确定,你是真的听懂了嘛?”

按照精准学AI技术负责人张宁的说法是:“对于AI辅助教学,从技术上来说已经成熟了,接下来就是工程实现和应用场景的调优了。”

【二】

从古典学习机到AI Native的学习机

从「助手工具」到「精准辅学」

在AI Native的原生应用领域,任何一次技术代际更迭,都会伴生着全新的应用交互创新。

正因为有上述AI能力,一个具有真人老师80%能力的AI老师,进行一对一辅学才成为了现实,而这又给最佳教辅工具的学习机,带来了全新的想象力。

当前,主流学习机市场,基本沿用「学习机+AI」思路,在既有硬件基础上,增加部分AI能力,更侧重于助手工具类应用,大部分拍照搜题、词典笔、习题集等都属于此类,往往内置各类学科知识、文学作品、百科等。

学生需要自己组合使用这些工具,效果完全依赖孩子的使用技巧和自主性,不少C端家长都抱怨这些产品过于“套概念”,买回去的学习机大部分都“吃了灰”。

但这并不能怪各大厂商们,从原理上讲,在AI大模型技术诞生之前,大家都做不出真正合格的学习机,因为过不了人机交互的体验阈值。

因为,有效学习必须同时解决三个问题:一是孩子坐得住,二是学习内容个性化,三是看视频能学会。后两个相对好解决,但第一个几乎无解。

“如今,我们通过与孩子及AI老师的全程连线和实时通话,终于同时解决了这三个问题,创造出合格的产品。”精准学创始人兼CEO杨仁斌说。

6月末,总部位于杭州的精准学,正式发布首个原生代AI辅学机Bong系列,在圈内引发了不小的涟漪。

500

Bong系列直接推出了「AI老师一对一辅学功能」,这是行业内第一次有产品绕过助手工具,正面提供一对一的AI辅学功能。

它的教育内核是「精准学习法」,即以个体学生学习效率最大化为目标,围绕学习目标,诊断识别学生薄弱环节,来组织各种学习资源,安排合理的学习次序,确保以最轻松的方式,依次学会运用。

整个学习交互不再是点戳屏幕,也不是看预先录制的视频,而是全程都开口跟AI老师直接对话,AI老师主导整个学习流程(什么时候做题,什么时候讲解,什么时候回答提问,一切都听AI来安排),学习交互界面是AI生成的,讲解和板书视频也由AI实时生成的。

可以简单理解,类似“高德导航+高阶辅助驾驶”,学生只要跟随AI就有最适合自己的高效学习路径,是更基于教育终局思维的产品。

将它称为学习机的iPhone时刻,还为时尚早,但它确实拉开了AI Native的学习机大幕一角。

【三】

如何打造一款AI Native的学习机?

需要一个六边形战士

前好未来教学产品设计总监李睿曾评价,“现有AI化的学习机,去掉AI,学习机还可以用。而真正AI Native的产品,如果把里面的AI去掉,不是差点意思,是根本没办法使用了。”

这个概念很好,各家都在朝这个方向努力,具体实现依然存在N多工程难题,真正打造一款AI Native的学习机,尤其实现AI精准辅学,需要六个关键能力,妥妥一个“六边形战士”。

我们以精准学为例,拆解一下它的工程实现路径,顺便也给这家公司打个分。为了方便理解,以线下1对1老师为参照物,对AI老师的5+1个能力维度进行还原。

500

✓ 拟真感知理解反馈能力(还原度95%)

为了提取辅学过程中的有效信息,尽可能1比1还原真实辅学场景,精准学辅学机在硬件上做了信息输入端优化,专门定制硬件,首创引入了AI感知理解和反馈功能。

将整个学习过程数字化,AI全程关注孩子学习状态,包括检测学生的21种坐姿体态、40多种情绪状态等,同时对他周围的视觉环境做充分理解,比如父母有没有突然走过来给他递一个水果,或者弟弟妹妹是否在干扰他学习;且把学习、做题的过程给理解进来,能够从学生的语言、语气等判断,得知现在学生的状态以及知识掌握情况。

加上多模态交互能力,这些相当于AI老师的眼睛和耳朵,在感官维度和信息输入上都做了升级。

✓ 拟真交互能力(还原度97%)

既然是一个虚拟的人类老师,它就得跟真实人类一样有感觉、有感情,耳听八方,眼观六路,这些都要在学习机上体现出来。

为了追求拟真人教师的效果,精准学技术团队在语音拟真度和实时性上做了大量调优,基本上跟人类正常的对话速度相近。

另外,“教师”形象的拟真度也影响着学习机的使用感受,讲话像一个老师还不够,包括场景、业务能力、世界观、语气风格等都要调优,感觉学习机对面就是真的老师,才不会在学习过程中“出戏”。

精准学自研虚拟老师技术,仅需10小时的视频数据训练,即可创建专属风格的高清AI老师,进行实时、低延迟的互动辅学。

✓ 大模型推理能力(还原度93%)

上面提到,当AI“老师”判断学生不在状态或者胡乱作答时,会直接通过对话提醒学生,并及时切换辅学风格,甚至与游戏结合来唤醒学生的兴趣,完成学习任务时会给出奖励。

AI“老师”能够根据所学的知识和当前面对的问题,快速准确的作出合理的决策,这种能力使辅学机在各种复杂的情境中能做出最佳的选择。

阿里巴巴的千亿级通义模型+精准学自主研发的“心流知镜”大模型,属于通用垂直强强联合的模式,200亿Tokens高质量辅学数据,16万小时的教育语音数据训练,能够自然地模仿超过20种个性化辅学风格,具备多模态、个性化交互能力。

✓ 教研数据能力(还原度92%)

在前6年时间里,精准学的模式偏To B,一直在幕后深耕,与包括高思教育、昂立教育等在内的数千家教育培训学校合作,帮助数百万学生提高学习效率和学习效果。

在此基础上积累了强大的数据库,形成了千万级题库、学情数据所组成的知识图谱,这些数据成为后来大模型训练的基石,直接影响了生成式AI内容的精确度和用户体验,在质的层面拉开区别。

结合“心流知镜”大模型的协同推理,使得AI老师可以“精通”各种教材、名师的解题和讲解方法。

✓ 实时生成能力(还原度90%)

学习交互界面是AI生成的,讲解和板书视频也由AI实时生成的。例如前面视频里的学习交互界面和整个对话过程都是由AI 根据孩子的实时情况而生成的。

✓ 钞能力(额外加成)

5月29日,精准学宣布获得新一轮2亿元融资,投资方是阿里巴巴,是今年唯一融资过亿的教育科技公司,可见阿里对其的重视。精准学的钱包不算最鼓的,但背靠大树还是有一定实力的。

这条单独拿出来,是因为它也很重要,关系到AI老师的全方位迭代效能。

【四】

内卷的市场恰好需要一条鲶鱼

重构家长心智和商业逻辑

精准学这个Timing刚刚好。

“双减”之后,学习机成为众多教培企业重点转型方向,甚至是少数公司的救命稻草。

2023年,整个学习机行业的出货量大约是500万台。当这个市场真正走向成熟之后,AI学习机每年的出货量峰值将会达到1500万台左右。

另据艾媒咨询的报告,2023年中国教育智能硬件市场规模达到了807亿元人民币,同比增长29.53%;多鲸产业研究院也预测,2025年教育智能硬件市场规模将接近千亿元,年复合增长率为25.8%。

AI这一波浪潮,让学习机的热度再一次狂飙,几乎所有的公司都在主打「AI+大模型」心智,一时分不清谁才是真正的技术流,毕竟家长们不是AI专家,从此刻的C端体验上来说,确实差别没那么大。

据不完全统计,目前市面上各类学习机产品种类不下百款,市场竞争尤为激烈,功能同质化、毛利急剧下降、消费者口碑也整体下滑严重。

归根结底,还是产品概念主义,缺乏实际学习效果,以至于《避免学习机智商税》、《x成家长后悔买了学习机》,去某社交平台上一搜,各种乱象吐槽,只是鲜有人揭开这层遮羞布。

市场太卷了,需要一条新的鲶鱼。

虽然各大学习机厂商,都在发力AI,但各家的理解、战略、研发、进度都有所不同。AI Native的学习机仍在早期阶段,迭代速度是关键,没有历史包袱、研发路径清晰、研发效率更高的公司更有机会胜出。

精准学入局的意义,不在于分食这个市场,而是进一步刺激市场不断扩大,引导行业向「终极形态」迈进。

AI Native的学习机不单纯是一台学习机器,而是一位“老师”、一套综合教辅能力解决方案,直接对用户的学习效果负责,其刚需性将直接重构家长消费心智,以及整个学习机市场的商业逻辑,目测将引发三个变化。

❶ 学习机代理机制会发生升级,毕竟学习效果驱动,销售说服成本会大幅下降,相比古典学习机,AI Native的学习机的代理利润空间将有提升;

❷ 同时,最近火起来的AI学习机+自习室模式会受到冲击,学习机不再依赖于自习空间及线下老师督促,孩子能自发完成闭环;

❸ 随着一人一师,千师千面的时代到来,学习机厂商自身的商业元素会更多元,定制化老师、AI名师等价值都值得挖掘。

精准学AI辅学机,作为第一款AI Native的学习机产品,这个卡位为其战略转型,打下一个很好的行业心智基础。

【五】

桃李财经的思考

为第一个吃螃蟹的点赞

不知道大家有没有一种感觉,商业世界正在被新技术切割成两个分区。

一边是下行周期为了生存不断苦苦挣扎,推新品、种草、大促、出货、做利润,勤奋的底色是悲观的;另一边是亢奋无比的技术流派,他们信心满满觉得新的Timing到了,供给侧正在迎来一次变革。

教育是公认最有机会出现生产力跃迁的超级行业之一,但其内核不是简单的数据+技术,而是回归学习场景,回归学习规律,克服学生和老师两端难题,显著提升教学质量和学习效果。

做教育的,多多少少要有一些理想情节;做技术的,多多少少要有一些终局思维。二者交汇处,才能真正提前看见未来。

精准学作为第一个吃螃蟹的,还是值得点个赞的。

全部专栏