8月6日消息,近日,小米举办2023第四届黑客马拉松“创想无界,生生不息”大赛,本次大赛产出了大量创新思维与先进技术相结合的项目成果,经评审,最终“小米AI识物眼镜-基于语义理解的视觉系统”获得一等奖。
“小米AI识物眼镜-基于语义理解的视觉系统”,以眼镜为载体搭载视觉识别系统,通过双目摄像头,对物品的名称、距离、位置、颜色,以及文本、人脸等进行多模态识别,为视障人群提供认人、认物、认路、认字等多种功能。项目创新性地将视觉识别模型和大语言模型进行有机结合,让用户不仅可以通过自然对话的方式了解眼前的世界,更能理解其逻辑关系,向真正“理解世界”又踏出了一步。同时,项目也为全尺寸人形仿生机器人CyberOne、以及CyberDog仿生四足机器人理解眼前世界进行了前沿探索。
二等奖项目“小米随心控-基于视觉识别系统的智能控制中心”,关注到了言语障碍人群的智能家居使用体验。现有智能设备多以手机控制和语音控制这两种方式来操控,然而语音控制并不利于言语障碍者使用。因此,团队成员设计了这款基于视觉识别系统的全新手势交互智能中枢,通过深度相机结合手势控制,计算手掌与设备的空间关系,让智能设备可以实现“指哪控哪”,以更自然的交互方式让更多人能够享受新科技的乐趣。