AI眼镜沙里淘金,小度或成最大变数

500

作者|鹿尧

过去的数十年里,科技巨头们不遗余力地投入智能穿戴设备的研发,其中智能眼镜是最受关注的品类之一。

不少行业先锋甚至将智能眼镜视为AI技术的绝佳载体,认为其不仅具备传统眼镜的功能,还融入了语音识别、自然语言处理、机器视觉等先进技术,为用户提供更加智能化、便捷化的服务。

然而,尽管智能眼镜被Meta、谷歌、苹果等大公司争相追逐,但它迄今为止并没有成为人们日常生活中不可或缺的一部分。原因很多,比如重量过大影响佩戴舒适度、续航能力欠佳、实用性与技术水平远没有达到人人满意的状态。

今年上半年,加入了新AI功能的Meta眼镜,为整个行业带来了新的突破。但和如今市面上大多同类型产品接入国外大模型一样,这款接入Llama 3的高科技产品,对国内用户,尤其是中文用户来说,其实还不够友好。

这在一定程度上反映出行业的尴尬处境:即便AI技术热潮汹涌,市场上仍旧缺乏一款真正适合中国人使用场景的AI眼镜。不过,百度世界2024上曝光的小度AI眼镜,或许能打破这一僵局。

届时,现有的市场格局或许被改变。

01

硬件产品与AI的化学反应

关于眼镜是否会成为未来最重要的智能设备的讨论,可以追溯到2012年,谷歌推出了Google Glass,凭借拍照、导航、信息推送等功能,将AI眼镜带入公众视野的同时,并一度被认为可能替代手机。

然而,愿景虽好,这款产品却止步于2015。大量用户吐槽佩戴的舒适性不够、操作不便捷,高昂的售价更是把大部分人挡在了门外。谷歌眼镜受挫后,AI眼镜进入了一个相对停滞的发展阶段,但人们对于智能设备的探索从未停止。

以往电脑和手机等智能终端,其实并不是完全为AI设计的产品。近几年AI行业蓬勃,人们越发强烈认识到,越来越成熟的AI市场缺少一个类似手机一样的物理载体。

说到AI,小度从诞生起其实就具备着AI的基因,从智能音箱、智能屏,到智能学习机、闺蜜机,基于对话式的AI语音交互,其不同品类的智能硬件已经覆盖超过4600万家庭用户。

而此次小度发布AI眼镜也带来了新信号:从家庭生活场景,到随身穿戴场景,产品线的再度拓宽,意味着小度也开始探索着打造更具创新性和交互性的智能设备,并寻求更多场景融合应用的转变。

500

不过,AI眼镜带来更高想象力的同时,也意味着更艰巨的挑战。

当前,行业内除了“具备AR功能的智能眼镜”和“无显示屏的AI眼镜”,还有一个日益受到关注的类别“音频眼镜”,但后者在功能上更接近传统耳机,主要侧重于音频体验,它们并不像小度产品那样会具备复杂的AI处理能力,所以并非真正意义上的“AI眼镜”。

以Meta的Orion与Ray-Ban Meta作为典型案例,前者采用AR里最前沿的方案,但这款让人惊艳的未来式产品,囿于产业链、技术成本等问题,当前也只能停留在原型阶段。相比之下,后者仍是普通眼镜的外观,技术上经过更新迭代,虽不具备显示功能,但可以拍照、翻译和对话,销量已经突破100万。

所以,Ray-Ban Meta的出现,更像是一个平衡了技术和需求后的产物。这恰好证明了颠覆性产品或行业的成长规律:并非一蹴而就,而是需要时间和市场的共同打磨。

同样的演进思路,在小度身上也得到了体现。

在洞察了行业现状,以及消费者对于随身智能助手的需求之后,小度的产品采用了“无显示屏的AI眼镜”设计,这么做的好处很明显:

在保持用户习惯的基础上,人们不承受显示能力附加的重量代价,就可以踮脚触碰到一个全新的交互形态;厂商也免于高昂的技术成本压力,将一个产品普及到大众市场,并在用户反馈和技术迭代中持续创新。

所以,单从配置规格来看,这款新产品并没有以“秀硬件”为主要目的,而是将重点放在AI技术在硬件上的应用,让用户更好的用上AI。

02

要做AI眼镜,首先要做好AI

对于一款真正的AI硬件产品来说,特别是像AI眼镜这样的新兴品类,核心不仅仅是硬件的单一方面,而是软硬件的深度融合。具体来说,硬件提供了基础的计算和感知能力,而软件,特别是AI大模型,则赋予了这些硬件更多的“智慧”。

对于小度这款AI眼镜来说,最直接的一点,就是搭载了中文大模型。

这样一来,不仅解决了以往智能设备在中文处理方面的诸多不足,例如语义理解不准确、中文语境复杂等问题。基于大模型重构的 DuerOS 操作系统,也给用户带来了更智能、更自然的交互体验。

500

此外,作为提升用户体验的关键,端到端的优化涉及从数据采集、传输、处理到呈现的全过程,因此厂商往往要根据任务的具体需求,如实时性要求和计算量大小,审慎权衡哪些操作适合在端设备(如智能眼镜、智能音箱等)上完成,哪些则更适合在云端进行处理。

从资源优化配置的角度来看,为了在不同的应用场景下提升使用效率,小度的端到端设计提供了一种更精细化的解决方案:既满足数据处理的实时性要求,并且可以灵活调整计算资源的合理分配。

从本质上来说,这是出于对产品适应性和实用性的考虑。

值得一提的是,在功能应用方面,不同于直接调用大模型API,小度的AI眼镜在开发时采用的是“软、硬件一体化”的产品思路,这要怎么理解呢?

一般情况下,当然是直接调用更简单,集成和部署也更快。但因为依赖外部接口和三方能力,会使设备在功能创新和个性定制方面受到很大限制。而且,缺乏软硬件深度整合,容易导致响应速度慢、数据处理效率低、设备不稳定等性能问题,更难以实现真正的智能化交互体验。

所谓的“软、硬件一体化”,其实就是软硬件协同设计。典型的例子,像苹果、小米这类的生态公司,有能力去同时整合软硬件资源,来达到硬件设计和操作系统的紧密配合。

体现在AI眼镜上,一方面硬件的设计可以充分考虑软件的运行需求,另一方面软件也可以结合特定的硬件架构进行优化。比如,针对 AI 眼镜的摄像头、麦克风、传感器等部件,整合设计和调优视觉识别算法和交互体验,以此提高设备的整体性能。

500

这种思路很巧妙。

对用户而言,一体化的集成设计,便于从系统层面进行产品质量的把控和优化,让多模态的交互体验更自然、流畅。对小度来说,软硬件一体化也能够给产品更大的创新延展机会,可以持续整合更多的先进技术,实现自研突破。

在此基础上,下一步需要考虑的是,小度自身丰富的应用生态,再加上百度地图、搜索、百科能力的融合,如何能更好的体现在这款AI眼镜上?

比如,眼镜作为第一视角设备,随着视觉、声音、位置等丰富信息的输入,借助AI大模型的推理、理解、生成等能力,无疑有极大的应用场景和想象空间。小度此次发布会上所展示的“边走边问”“识物百科”等能力,正是如此。

从看世界,到懂世界,才是AI眼镜真正的价值所在。

03

乐观一些,或许未来已来

事实上,对于长期关注科技领域的人来说,AI眼镜的确不算个新的概念,但很长时间以来,由于技术和市场接受度等因素,它的确更多停留在概念层面。

随着技术的不断成熟和应用场景的持续拓展,AI技术正逐步从上半场的“概念验证”阶段,步入下半场的“规模化应用”阶段。背后的逻辑在于,让技术变得人人可用,这正成为行业共识的缩影和新的起点。

AI眼镜的改变也是一点点发生的。

贝哲斯智能眼镜市场研究报告恰恰验证了这一点,2023年全球智能眼镜销量为101万台,而2024年一季度出货量同比增长了217%‌。预计到2029年,全球智能眼镜市场规模将接近1068亿元。

就拿最基本的硬件规格来说,过去很多人不看好AI眼镜,最直观的一个原因就是重量太重,佩戴感不好。尽管小度AI眼镜尚未正式上市,但通过目前披露的情况来看,它的确会是一款值得期待的智能穿戴设备。

首先,它的重量仅有45克,对比行业主流水平来讲要更加轻便,镜腿尺寸也更小巧,日常佩戴和普通眼镜基本无异。

在摄像方面,它搭载了1600万像素超广角镜头,支持最高4656*3496像素拍摄,包括超越了Ray-Ban Meta在内的很多同类产品。

还有一个大家关心的续航问题。据介绍,小度AI眼镜可支持连续听音乐超过5小时,远超行业平均的3小时,而且30分钟即可充满电。

500

作为一个可以全天候架在眼前的设备,它可以随时聆听你的召唤,相比掏出手机或打开电脑,AI眼镜成为多模态感知技术更有的放矢的第一终端。

人机交互形态的变化,软硬件领域不断的技术积累,使得人们逐渐相信科技公司描绘的未来,当AI眼镜跨过了佩戴舒适度和实用性的门槛,或许的确能成为比手机更适合作为AI的载体,甚至有望是人机交互的第一入口。

在这一点上,小度的确迈出了重要一步。

最近更新的专栏

全部专栏