秋收冬藏 发表于 2024-5-11 23:01:20

OpenAI周一发布会更多细节被挖出:ChatGPT可能实现电话功能

  转自:AI寒武纪

  要实现电话通话,至少需要以下几个关键能力:语音识别;语音合成;3、实时交互;这些技术OpenAI都有了,现在就看最终的产品了。

  OpenAI 似乎正在努力在 chatGPT 中实现电话通话。这可能是周一宣布的活动的一小部分,这一点从OpenAI网站一些后台代码就可以发现


https://58.ca/data/attachment/images/usstock/ytekm1d21ni.png
  现在,OpenAI 也已配备了 webRTC 服务器来实现这一目标,这些服务器最近也进行了配置


https://58.ca/data/attachment/images/usstock/gi1iopjairq.png
  起初大家以为webrtc被用于他们的纯语音模式,但事实证明那是由Livekit完成的


https://58.ca/data/attachment/images/usstock/ebzun0hn4hy.png
  早就2月份,OpenAI前开发者关系负责人就提及,ChatGPT的终极形态不是聊天,看起来和现在的信息对应上了


https://58.ca/data/attachment/images/usstock/a24fmzxutel.png
  要实现电话通话,至少需要以下几个关键能力:

  1、语音识别 - 将语音信号转换为文本

  2、语音合成 - 将文本转换为自然语音输出

  3、实时交互 - 能够在通话过程中实时处理对方的语音输入并作出响应

  这些技术OpenAI都有了,现在就看最终的产品了

  OpenAI语音技术负责人也转发了周一发布会的推文


https://58.ca/data/attachment/images/usstock/pqgssyaid4k.jpg

https://58.ca/data/attachment/images/usstock/lmdky2chgg0.png


页: [1]
查看完整版本: OpenAI周一发布会更多细节被挖出:ChatGPT可能实现电话功能