近期,WIPO公布了一项与苹果AR/VR相关的新专利,这项专利名称是“会话和环境转录”(编号:WO2022266209),其内容重点介绍了一种主动和反应式辅助转录应用,可将视频通话转录成文字对话,该应用兼容多款硬件设备,包括电脑、AR/VR头显等等。
值得注意的是,这项专利似乎来自苹果在2020年收购的VR公司Spaces,专利发明者包括前Spaces联合创始人兼CEO Shiraz Akmal、前Spaces联合创始人兼CTO Brad Herman,二人目前就职于苹果AI/ML未来体验部门。据悉,Spaces孵化于梦工厂动画,此前曾开发VR主题公园、大空间VR内容,还推出了VR虚拟会议平台,允许VR和非VR用户进行视频通话。
回到专利上来,今天报道的苹果专利就涉及了VR和非VR视频通话技术,看起来似乎可接入苹果旗下的各类设备、平台。苹果在专利中指出,这项方案与传统转录系统不同,它可以根据对话上下文、会话主题、环境因素来提升转录的效果。此外,它还可以追踪用户的注意力状态,并通过文字转录来协助用户跟上会话进度。
在AR/VR交流场景中,该系统还可以对用户所处环境进行翻译。在一些场景中,转录系统可根据环境变化而触发,比如对话背景噪音超过阈值、信号不好对方听不清时,便可通过文字转录来提升交流效率。
参考:PatentlyApple