科技魔方

OpenAI 部署新功能,ChatGPT 将具备电话通话能力

更多场景

2024年05月13日

  OpenAI正在为其流行的语言模型ChatGPT部署一项特别的新功能,该功能将使其能够进行类似电话通话的交互。这一更新预计将在周一的某个活动中公布。

  为了实现这一功能,OpenAI 已经部署了必要的 WebRTC(Web Real-Time Communication)服务器。尽管最初人们认为 WebRTC 仅用于 ChatGPT 的语音模式,但后来发现实际上是通过 Livekit 这一流媒体服务来实现的。

  新功能的主要特点包括:

  直接语音对话:用户将能够在 ChatGPT 的界面上直接通过语音与其进行对话,类似于传统电话通话。

  增强的互动性:这种新交互方式可能使 ChatGPT 更加互动和实用,为用户提供更丰富的沟通体验。

  语音到文本的转换:目前 ChatGPT 支持的语音功能主要是将用户的语音输入转换为文本,然后以文本形式回复。

  实时语音交流:整合电话通话功能意味着 OpenAI 可能在扩展到更直接的语音交流,允许用户和 ChatGPT 进行实时的语音对话。

  无需屏幕的交流:新的语音对话功能将模拟真实的电话对话,使用户能够在不查看屏幕的情况下与 ChatGPT 进行交流,提高便利性。

  OpenAI 的这一创新尝试将 ChatGPT 的应用范围扩展到了更直接的语音交流领域,预示着未来人机交互可能会更加自然和流畅。

+1

来源:站长之家

延展资讯