法国开源AI研究实验室KyutAI发布了一款全新的多模态大模型Moshi。这不仅仅是一个技术突破,更是对现有AI技术的一次大胆挑战。
7月4日凌晨,Kyutai在官网宣布了Moshi的到来。这款模型的功能与OpenAI在5月展示的GPT-4o相当,能够听取人的语音提问并实时进行推理回答。但与GPT-4o的语音模式要等到秋天才能全面开放不同,Moshi已经可以被大家使用。
主要特点:
多模态能力:Moshi可以听取人的语音提问后进行实时推理回答,而且它的语音模式已经开放,比GPT-4o的秋天上线要快得多。
无区域限制:无论你身在何处,都能使用Moshi。
手机移动端支持:虽然对普通话支持不太好,但用英语提问完全没问题。
即将开源:Kyutai计划很快开源Moshi,届时将公布代码、模型权重和论文。

体验地址:https://top.aibase.com/tool/moshi-chat
Moshi的发布,无疑是对AI技术的一次大胆尝试。它不仅具备听、说的能力,未来还可能展示出看的能力。这让我们对AI的未来充满了期待。而且,Moshi的使用过程非常简单,只需登录官网,填写邮箱地址,点击加入,就能开始与Moshi进行对话。
官方演示视频
值得一提的是,Moshi对普通话的支持还有待提高,使用英语提问会得到更好的体验。此外,Moshi不锁区,无论身在何处,都能直接使用,这无疑为全球的AI爱好者提供了极大的便利。
官方演示
Kyutai实验室的这一举措,也显示出了他们对开源精神的坚持。他们计划很快开源Moshi,公布代码、模型权重和论文,让全球的开发者和研究者都能参与到Moshi的开发和优化中来。
使用感受
响应速度快:即使是在国区线路上使用,Moshi也能几乎无延迟地响应提问。
语言支持:目前Moshi主要支持英语和法语,中文普通话支持有待提高。
使用便捷:注册流程简单,只需提交邮箱即可。
能力展示:Moshi展示了听和说的能力,未来可能还会增加看的能力。Moshi的拟人化语气是其一大特点,机器味很少,这让对话体验更加自然流畅。
当然,Moshi目前的回答内容还比较有限,只能提供大致的轮廓和概要。但随着产品的不断迭代和优化,我们相信Moshi的回答将变得更加详尽和准确。
此外,Moshi的发布对教育行业也将产生深远的影响。例如,AI可以为学生提供循环讲解,这对于教育帮助是巨大的。我们期待未来能有更多类似的产品出现,支持更多地方语言,让AI技术更加贴近人们的生活。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则