内容持续更新中
OpenAI 在开发者日发布了升级版的自动语音识别模型 Whisper3,该模型具备多语言支持,可以快速准确地将音频转录成文本。OpenAI 计划未来开放 Whisper3 的 API,以推动语音处理…
腾讯云最新推出的语音识别系统 ASR 进行了升级,提高了处理方言和噪声的能力。ASR 支持识别 23 种地方言,并能应对方言混战的情况。通过自研的混合识别引擎,ASR 能快速识别并切换不同方言。采用蒸…
2025年1月20日,豆包 App 正式发布了其最新的 “端到端” 语音大模型,并对实时语音通话功能进行了重要更新。这一进展标志着豆包在语音交互领域的又一次飞跃,超越了之前的 ASR(自动语音识别)、…