内容持续更新中
OpenAI 的旗舰模型 GPT-4o("o" 代表 "omni")在五月份发布时,其音频理解能力备受瞩目。GPT-4o 模型能够以平均320毫秒的速度回应音频…
摩尔线程近日宣布开源其音频理解大模型MooER(摩耳),成为业界首个基于国产全功能GPU训练和推理的大型开源语音模型。MooER不仅支持中英文语音识别,还具备中译英的语音翻译能力,展现了强大的多语言处…