抛弃翻译、提词、导航:AI眼镜开启“减法革命”

AI眼镜,首先应该更像眼镜。

这一看似朴素的认知,却是当下整个智能眼镜行业最稀缺的产品逻辑。

过去数年,“智能眼镜”最常见的命运是:开箱惊艳三天,然后被收进抽屉。

原因不是AI不够聪明,而是它太重、太厚、太像“电子产品”,以至于你每一次照镜子都在提醒自己:这玩意儿不是为脸设计的。

另一面,整个AI眼镜赛道却始终处在高速内卷的狂欢之中。各大厂商扎堆堆砌功能,将翻译、提词、导航、AR显示、智能交互等五花八门的能力尽数塞进小小的镜框与镜腿之间。行业陷入一种固化的创作惯性:功能越多,产品竞争力越强,故事越饱满,商业估值也就越高。

而Moonix的总裁郭于晨认为:问题并不在AI能力,而在于大多数厂商忽略了眼镜最基础的一件事:“它首先得是一副可以被长期佩戴的眼镜。”

眼镜行业有一条朴素的经验:要让人愿意长期佩戴,重量必须压下来。很多畅销的无框/半框传统眼镜会把重量控制在十几到二十几克;一旦设备把扬声器、麦克风、摄像头、电池、主板、传感器一股脑塞进镜腿与镜框里,整机很容易跳过30g、直奔40g甚至更重——那它就很难摆脱“戴一会儿就得摘下来”的命运。

郭于晨说得更直白:“佩戴性是前面的1,功能是后面的0。没有1,乘再多的功能还是0。”所以他们把目标钉在“先把眼镜做回眼镜”:4mm超细镜腿、整机约14.9g,没有显示、没有光波导、没有把导航/翻译/提词器当必选项,核心回到音频 + 第一视角记录这件事上。

在人人做加法的AI硬件时代,Moonix的反向减法打法,不仅重构了AI眼镜的产品形态,更重新定义了AI原生硬件的底层逻辑。为何选择在赛道红海期逆势入局?为何敢于砍掉全行业追捧的热门功能?AI眼镜的大众化出路究竟在哪里?针对行业争议与产品思考,我们与Moonix总裁郭于晨展开了一次深度对话,拆解这场AI眼镜的“减法革命”。

500

Q: 现在头部的AI眼镜厂商基本上都是14、15年左右成立的,在25年这个时间节点入局AI眼镜市场,不觉得晚吗?

于晨: 我反而觉得,一切才刚刚开始。

到目前为止,AI眼镜的出货量与手机仍不可同日而语。所以说AI眼镜还远没有达到大众消费阶段。

另外,我认为这一轮AI硬件真正被重新定义,都源自于ChatGPT的横空出世。尤其是最近这一两年多模态的兴起,才让AI硬件有了更强的生命力,这是一条新的起跑线。

过往的所谓AI眼镜的思路,更多还是基于旧有的智能硬件思路,添加一些AI对话、游戏、提词、导航之类的功能。本质上是把手机的一些应用嫁接到了眼镜上,试图来取代手机,成为下一代的通用计算平台。这其实是一种迁移思维,把手机已有的功能迁移到眼镜上面。

但是现在的AI能力提供了一些新的思路,我们怎样才能做一款AI原生的硬件产品,所以从这个角度来说,大家其实都站在新的起跑线上。

Q 我的理解是您觉得AI原生的定位是Moonix其他AI眼镜厂商的一个核心的不同点?AI原生的定位具体体现在哪些方面?

于晨:  对,是的。在我看来,所谓的AI原生,最重要的特点是其输入和输出的泛化性。

上个时代的硬件都是固定的输入和输出,即在限定规则的情况下,去完成限定的任务。比如说Walkman这个产品,就是限定了播放、暂停、回退这几个基础功能,用户只能在既定规则下完成操作。14年、15年的最早的一批智能眼镜,也是这个思路下的产物。

相比之下,AI原生硬件的区别就在于它完全基于 AI 的技术特点,让输入不再收到既定规则的约束,比如它允许用户通过自然语言来完成设备的控制。这种变化,让硬件的使用边界被重新打开。

Q: 您觉得AI眼镜的终极形态是替代手机的一个超级终端吗?

郭于晨: 我不敢这么说。我觉得很多东西都是自然演化出来的,如果我们预设了“它一定要代替手机”,反而会变成一种技术导向的路径依赖,让思考的角度脱离用户需求。这种思路已经被反复验证是一种错误。

我们不倾向做这样的预设,我们更希望先回到用户本身去构建产品。

Q 为什么是眼镜?而不是一个挂在身上的摄像头?

于晨: 因为眼镜天然是最接近人类感知系统的设备。

首先,它能够跟随人的视线变化。人转头、观察、停留,这些信息只有第一视角才能天然捕捉。

其次,眼镜本身已经是成熟的日常配饰。相比挂件类产品,它的侵入感更低,也更容易融入真实生活场景。我很难想象女性用户都戴着同一款挂坠去参加一个活动,看上去很奇怪,像是某种电子镣铐。

另外,从记录角度来说,眼镜也天然具备开放式传感器优势:视野更完整、收音更自然,不容易受到遮挡或衣物摩擦影响。所以我们认为,记录其实是最符合眼镜形态的能力之一。

Q:这个优势怎么理解?

郭于晨:AI眼镜这个形态作为配饰入驻主流线下渠道,最难的点是在于它没有办法跟传统的眼镜做正面竞争。因为所有眼镜用户到线下场景去购买眼镜的第一动力是它好看以及舒适度。在这种情况下,一个消费者走进线下零售场景时,看到那种粗壮的眼镜,本能上是排斥的,后面也很难接受听你讲眼镜的功能。

我们的眼镜最大的优点就在于:它跟普通眼镜几乎没有任何区别。我们将眼镜的重量做到了14.9克,很多传统眼镜都不一定能做到14.9克,但是我们做到了。所以我们的产品可以直接在线下渠道和那些传统眼镜摆在一起,这是一个非常大的优势。

Q 为什么您对眼镜的重量如此执着,为了做到这个重量,放弃了哪些东西?

于晨: 因为我们一直认为,眼镜首先是一个“长期佩戴”的产品。只有当用户愿意每天戴着它,它后面的所有能力才有意义。

所以我们会优先考虑那些真正高频、长期存在的需求,而不是一些偶发性的场景功能。比如我么放弃了诸如提词、翻译、导航这些低频功能需求,我们更关注记录能力。因为记录是一个天然高频、且最符合眼镜形态的需求。

我们也希望在用户心智层面建立两个认知:第一个就是我们的眼镜极致轻薄,另外一个就是我们的眼镜具备强大的记录和感知的能力。

Q: Moonix在刻意弱化科技表达,是一种错位竞争的策略吗?

于晨:我们只是希望给这个行业提供一个不同的答案。

我们时刻提醒自己不要陷入所谓的技术优越感之中,因为科技产品最终是要服务于人的,所以它的消费体验才是最重要的事情。我不强调科技性,本质上也是因为我觉得目前大部分智能眼镜的功能点,都不太经得起推敲。

Q:您觉得哪些功能经不起推敲?

于晨: 比如说提词器这个功能。首先它太低频了,对于一个普通用户来说,真的会为了一个一年就用一次的功能,去忍受这个重量,天天带着智能眼镜吗?另外,提词器功能对于一场演讲来说,到底是加分项还是减分项呢?

再比如说翻译功能,听起来好像是一个很实用的功能。但其实我们用到翻译功能的场景大多数时候是与人交流。但眼镜搭载的翻译功能只是个单向翻译,只能解决我能听懂老外说话,解决不了老外听不懂我说话的问题。

相对匹配的场景可能只有我在国外听一些公开演讲。但这种情况的频率又有多高呢?

根本的问题还是大家在用技术或者一些主观预判来反推产品的功能,这种思路大概会得到一个伪需求。

Q 咱们的产品主打一个无感记录和AI隐身,为什么您觉得AI需要隐身?

于晨: 好的科技其实一定是不打扰用户的,这个是最重要的事情。

而无感记录这件事情,还有一层更深层的含义。当我们用工具去尝试拍出一些好照片时,我们往往会失去体验那个场景的沉浸感。因此,我希望能把记录这件事情让渡给工具,而让人能够完完全全地去体验当下。

Q 无感记录的具体体验其实就是不需要唤醒,我可以这么理解吗?

于晨: 对,我们有一套机制,每5分钟会主动记录身边周遭的内容和环境,这个是我们所谓的无感记录。

Q 如果不需要唤醒,又是一个定期主动记录的机制,用户的隐私和周围人的隐私如何保护呢?

于晨: 首先,我们定义的低频主动记录,只能够帮用户记录一些大面的信息,比如说当下的环境、状态。如果需要详细的记录,还是需要用户手动去按键开启持续记录的。

其二,我们对用户的承诺,所有的这些用户数据都不会被用于训练。未来我们还会开源所有关于用户数据处理的部分,接受全行业的审视。同时,我们也不希望AI眼镜成为一个偷拍神器,我们想做一层隔离,所有被眼镜拍摄下来的原始数据,都是不能直接被戴眼镜的用户所读取的。用户能拿到的数据,一定是被AI安全鉴定和加工处理过的。

Q 本身就戴眼镜的用户会需要两副眼镜换着带吗?

于晨: 我们的眼镜其实是有镜腿快插结构的。最终的售卖逻辑是:一副普通眼镜,加一个智能镜腿。用户可以在不需要AI眼镜的场景直接换上普通镜腿。

Q咱们两款眼镜的上线时间和大概价格?

于晨:定价没有完全确定,预计在 2500 元 左右。今年 6月底,我们的标准版就会正式售卖,请大家拭目以待。同时我们的PRO版本也会在 8 月底正式售卖。

Q 公司后续的融资计划是怎样的

于晨: 我们目前已经完成了第一轮千万级的融资,下一轮的融资目前刚刚开始。

站务

全部专栏