科技魔方

微软向 30 亿人推出免费的 Seeing AI 应用:帮助盲人和低视力群体了解周围环境

大模型

2023年12月05日

  在国际残疾人日这一特殊的日子,微软发布新闻稿宣布,微软最新的人工智能技术驱动下的 Seeing AI 应用程序最新版本现已推出,并首次在 Google Play 商店提供安卓版下载。借助今天的安卓版本发布,Seeing AI 现已支持 18 种语言,并计划在 2024 年扩展至 36 种语言。

  Seeing AI 是一款免费应用程序,旨在为盲人和视力障碍人士提供移动设备上的世界解读服务。该应用支持用户完成各种日常任务,如阅读邮件、识别日常产品、听取照片描述等。

  根据用户反馈,新的安卓版本包含了最近在 iOS 上发布的最新生成式 AI 功能:丰富的照片描述:在场景频道上提供照片的简要概述之外,现在您可以点击「更多信息」以生成包含更多细节的丰富描述。 与文档对话:扫描文档后,除了听到它的朗读外,您还可以与 Seeing AI 对话,询问诸如菜单上的项目、收据上的商品价格或文章摘要等问题。

  微软表示,利用其技术为残疾人士创新。Seeing AI 最初于 2017 年作为研究项目发布在 iOS 上,当时微软的工程师团队与盲人社区合作,探索技术能够提供更大独立性和乐趣的领域。

  通过 Seeing AI,您只需对准相机或拍照,即可听到描述。切换不同频道,以听取专注的信息: 短文本:相机前出现文本时即刻朗读。 文档:提供音频引导以捕捉印刷页,并朗读内容及其原始格式。与 Seeing AI 对话,快速查找信息。 产品:扫描条形码,通过音频提示引导;听到产品名称和包装信息(如果可用)。 场景:听到捕捉场景的描述,并点击「更多信息」生成丰富描述。在屏幕上移动手指探索照片,听到不同物体的位置。 人物:识别周围的朋友。 货币:识别纸质货币。 颜色:识别感知到的颜色。 手写:阅读如贺卡中的手写文本(仅在部分语言中提供)。 光线:生成与周围亮度相对应的音频音调。 其他应用中的图片:与 Seeing AI 共享照片进行识别。

  全球有超过 30 亿活跃的安卓用户,将 Seeing AI 引入安卓平台将使更多盲人和低视力社区的成员能够在日常生活中利用这项技术。微软表示其将继续与社区合作,了解反馈,以改善应用程序。随着后续版本的推出,用户反馈将对 Seeing AI 应用未来版本的新 AI 功能增强至关重要。

+1

来源:站长之家

延展资讯