朱清毅:不预扫描 不遥控 全球首台自主导盲机器人的诞生之路

500

我失明了三十多年,同时我也是一位,拥有二十六年软件编程的,盲人软件工程师,如今我和我的团队,历经六年的时间,成功研发了全球首个,无需预扫图,也不需要人工遥控的AI LOOK盲人助理机器人。

这款机器人从最初的一个idea,到后面的由外观设计,结构设计、电路板设计、芯片设计直至最后的人工智能算法,大模型算法,以及产品的装配,都是由我们团队自主完成。

这个产品在出行的时候,它会引领我们盲人在盲道上行走,遇到障碍物也会精准地绕开,随后还会回到盲道上来,那我们在行进的过程中,也可以选择自主引领,或者是推行服务。

有的朋友就比较担心了,那如果没有盲道的地方,你们是怎么解决的呢,那就是要看我们机器人的巡航模式,不管是在农村还是在城市,不管在社区还是在公园,它都可以带着我们,去到我们想要去的地方,特别是在公园里边,两边的绿地有的都会低于路面,不管其路径多么曲折蜿蜒,但是机器人,仍然可以带着我们自由地出行。

散步这件事情对普通人而言,是一件再简单不过的事情,可是我们盲人却是特别奢求,AI LOOK在出行过程中,它会绕开各种各样的障碍物,不管是大的小的,还是高的矮的,会精准地避开各种障碍物,这是我们盲人出行过程中必备的,也是必须的一种安全保障。

在出行遇到台阶的过程中,如果是下台阶,它会提前刹车,并且通过语音告诉我们,前面有下台阶,并且告诉扶手在哪个方向,那么在过马路的时候,产品会精准地识别红绿灯,当绿灯亮了的时候,它会立刻锁定斑马线,带着我们盲人,顺利地通过整个路口。

500

十年前,我读EMBA的一次游学经历,深深触动了我,就是在参观一家智能工厂的时候,在工厂里面有很多智能机器人,通过灵巧的机械臂,在做焊接和运输工作,偌大的车间里面几乎没有人,当时被称为无人车间。

于是我在想,中国有1731万盲人,如果有机器人,能够为我们盲人引领这样的服务,该多么的好,我深信每一个盲人,实际上都希望有一个,属于自己的专属服务机器人,我们盲人群体更需要一台,属于我们自己的导盲机器人。

于是我开始关注各类导盲科技产品,我体验过能语音描述场景的智能眼镜,尝试过各种形态的可穿戴设备,每一次体验都带着希望,但是往往都是带着困惑告终,它的功能很强大,但是 总是隔着一种壁垒,它试图告诉我这个世界的样子,却很少思考,我真正需要以何种方式来进行互动。

500

随后一系列互动在我心中发芽,一个理想的导盲产品,究竟应该是什么形态,是酷炫的机器狗,是嵌入智能的眼镜,还是增强版的电子盲杖,它应该是四足行走仿生自然,还是轮式移动,高效平稳,盲人出行核心需求到底是什么,仅仅是需要能说话的眼镜,来描述左边有一颗树,右边有一辆车,还是更需要一个,能够自主规划安全路径,引领避障的伙伴呢,其功能边界在哪里。

更重要的是,任何美好的设想,最终都要面对现实的拷问,相应的硬件技术能否实现,成本能否控制在普通家庭,能够承受的范围之内呢,这些思考没有现成的答案,而我知道,最有可能找到答案的地方,不在顶尖公司的实验室报告里,而在我们盲人自己的日常中,在每一次驻足的过程中,每一次谨慎的试探里。

500

六年前,我和同事组成了一个研发小组,我是其中的唯一的一个盲人,也有朋友善意提醒说,很多公司都在做类似的研究,投入非常大,你确定要自己从头做起吗,我的回答很坚定,正因为是大公司在做,他们可能更需要一个,来自真正使用者的视角,他们研究盲人,而我就是盲人本身。

我们的第一步是回归本质,不把机器当人,更不能把人当机器,我们要设计的是一款人机协同的产品,就像盲杖是手臂的延伸,而未来的机器人,应该是感知与行动能力的延伸,在这段协作的过程中,人应该负责什么,机器应该承担什么呢。

第二步攻克看见的难题,我们沉浸于视觉与深度学习的世界,我们在办公室搭建各种障碍物的场景,用摄像头连接电脑,一遍遍地训练模型,识别桌椅、箱包、行人等等,成功了吗,可以算是是成功了一半吧,机器能认出是什么,但是它不知道那里有多远,无法判断距离,避障就无从谈起。

这促使我们迈出第三步,为机器装上深度视觉,我们用纸箱做机身,装上主板,深度相机和激光雷达,做出了第一个笨拙又可爱的原型机,当它第一次认出前方有一把椅子,还准确地说出了,正前方0.8米有椅子的时候,我们摸到了门道。

500

然而新的瓶颈接踵而至,当时很多导航方案,都依赖于提前扫图,把建筑物内部扫描一遍,生成地图之后,机器才能在其中工作,这就像让盲人走背过的地图,很不现实,我们要打破这个桎梏,我们如何让机器像人一样,在完全陌生的环境中,实时理解周遭的一切,让它自主做出安全的决策,而不是向后方遥控,如何让它应对从办公室,到火车站各种极端场景中,这是一段漫长艰难的破茧过程,无数个日夜的算法优化,无数次在测试中碰撞调整。

500

终于,我们第一代原型机诞生了,它是一个轮式带有扶手的机器,机器人身上集成了多种传感器,它最大的特点就是不需要预扫图,不需要人工遥控,能实时理解动态变化的环境,并用自然语言与我交流。

我永远忘不了,在烟台高铁站上那次测试,那是它第一次面对如此复杂拥挤,充满不确定性的真实世界,我握着它的扶手,它平稳地引领我前行,我的耳边不断传来,它清晰冷静的语音提示,前方三米有楼梯,共12阶,右侧有扶手,左侧有共享单车,请注意右前方,通往售票大厅,当前人流有些密集,注意稍等待。

这一切让我这个盲人,第一次在这个陌生的大型交通枢纽,也产生了前所未有的安心,所以我知道 我们创造的不是一个工具,而是一个真正的领路人,2023年,这项技术获得了国家发明专利,产品被正式命名为,AI LOOK盲人助理机器人,这是国内也是国际首个,唯一一个实现无需预扫图,全自主实现导航的导盲机器人。

500

我给朋友们展示这个产品,在这个过程中,很多人就提出来,你这个机器人轮式的怎么上台阶,为什么不做成更酷的四足机器狗,那样不是更好吗,这些问题非常棒,它们恰恰揭示了,产品设计中最关键的陷阱。

以健全人的视角,去想象我们残疾人的需求,关于上台阶,我们首先要问,什么的样人必须依赖机器来爬台阶呢,那肯定是腿不好或者失能人士,而我们盲人腿脚完全正常,我们需要的是让机器告诉我们,这个台阶的具体的详情是什么,比如高度有多少节台阶,有没有扶手。

那么确保机器要轻便,我们AI LOOK才有12斤重,上下台阶的时候,我随时可以提起来,如果为了上下台阶,增加各种各样的机械结构之后,成本和重量大幅增加,反而降低了实用性。

关于这个机器狗,我们做过详细的对比,一只四足机器狗,它的重量30到80斤,待机时间只有两到三个小时,价格是8万到15万元,而我们的AI LOOK重12斤,待机有8到12个小时,价格三到五万元。

更重要的是,机器狗在上下台阶的时候,往往需要关闭避障功能,在复杂台阶的这种情况容易摔倒,对周围行人也能造成风险,而我们AILOOK在遇到台阶的时候,它可以轻松地提起来,它瞬间变成一个带轮子的智能盲杖,灵活自由,所以说哪一种更合适呢,这个答案不言而喻。

500

那么这些对比告诉我们最朴素的原理,最好的导盲产品不一定是炫酷的,但一定是最理解我们盲人生活场景的,最尊重人机协作本质的,谢谢。AI LOOK它不仅是一个产品,它是一扇窗,让我看到了技术所能照亮的,更广阔的未来。

第一,盲人助理机器人只是一个起点,它背后不断进化的人行通道视觉大模型,是机器真正理解物理世界的眼睛,这双眼睛可以赋能千行百业,未来配送机器人,将不再局限于固定的轨道上,它能理解小区的复杂路径,安全地可以把快递送到人们手中,具身智能机器人将因此走向街头,融入我们的生活。

第二点,这将引发一场深刻的人机交互革命,当机器像AI LOOK一样实时理解环境,并用自然语言流畅交流的时候,它们便不再是冰冷的,僵硬的执行工具,而是能够感知情景,自主决策,与人协作的智能体,人与机器的关系,将从命令与服从走向对话与协作。

第三,也是我最深切的期盼,这种技术,将重新定义残疾与能力的边界,视障本身就是信息获取渠道的缺失,当环境足够智能的时候,能够用无障碍的方式,将视觉信息实时转化为,我们可理解的声音 触觉信息时,视障或许就不再是一种缺陷,这是一种新的感受方式,技术将弥合这个鸿沟,我们所追求的,从来不是把盲人变成明眼人,而是创造一个无论身体条件如何,每个人都能平等,自信安全地参与其中的这种社会。

500

回望这段旅程,我非常感动,一个盲人工程师研发的产品,最终被证明是最适合这个群体的,没有切身的体验,就没有真正的发言权,任何脱离真实场景的凭空想象,最终都可能造成一个闭门造车的产品,而闭门造车的危害,远不止是浪费一点金钱,它浪费了科技本应服务于人的初心,消耗了用户对科技改变生活的信任与期待。

朋友们,光明从来不止于肉眼所见,它是对世界的好奇,是对未知的探索,是在困境中依然相信可能,是用自己的微光去点亮的容器。我手中的这个AI LOOK是我触摸世界的方式,也是我献给这个世界的光,这条路,我和我的团队会继续走下去,我们相信当科技拥有了温度,当创新植根于同理心,我们终将抵达一个更加包容,更加美好的未来,在那里每一束光,都不会被辜负,谢谢。

站务

全部专栏