法国开源AI研究实验室KyutAI发布了一款全新的多模态大模型Moshi。这不仅仅是一个技术突破,更是对现有AI技术的一次大胆挑战。

7月4日凌晨,Kyutai在官网宣布了Moshi的到来。这款模型的功能与OpenAI在5月展示的GPT-4o相当,能够听取人的语音提问并实时进行推理回答。但与GPT-4o的语音模式要等到秋天才能全面开放不同,Moshi已经可以被大家使用。

主要特点:

  • 多模态能力:Moshi可以听取人的语音提问后进行实时推理回答,而且它的语音模式已经开放,比GPT-4o的秋天上线要快得多。

  • 无区域限制:无论你身在何处,都能使用Moshi。

  • 手机移动端支持:虽然对普通话支持不太好,但用英语提问完全没问题。

  • 即将开源:Kyutai计划很快开源Moshi,届时将公布代码、模型权重和论文。

对标GPT-4o!开源大模型Moshi震撼登场:无区域限制,手机兼容

体验地址:https://top.aibase.com/tool/moshi-chat

Moshi的发布,无疑是对AI技术的一次大胆尝试。它不仅具备听、说的能力,未来还可能展示出看的能力。这让我们对AI的未来充满了期待。而且,Moshi的使用过程非常简单,只需登录官网,填写邮箱地址,点击加入,就能开始与Moshi进行对话。

官方演示视频

值得一提的是,Moshi对普通话的支持还有待提高,使用英语提问会得到更好的体验。此外,Moshi不锁区,无论身在何处,都能直接使用,这无疑为全球的AI爱好者提供了极大的便利。

官方演示

Kyutai实验室的这一举措,也显示出了他们对开源精神的坚持。他们计划很快开源Moshi,公布代码、模型权重和论文,让全球的开发者和研究者都能参与到Moshi的开发和优化中来。

使用感受

  • 响应速度快:即使是在国区线路上使用,Moshi也能几乎无延迟地响应提问。

  • 语言支持:目前Moshi主要支持英语和法语,中文普通话支持有待提高。

  • 使用便捷:注册流程简单,只需提交邮箱即可。

  • 能力展示:Moshi展示了听和说的能力,未来可能还会增加看的能力。Moshi的拟人化语气是其一大特点,机器味很少,这让对话体验更加自然流畅。

当然,Moshi目前的回答内容还比较有限,只能提供大致的轮廓和概要。但随着产品的不断迭代和优化,我们相信Moshi的回答将变得更加详尽和准确。

此外,Moshi的发布对教育行业也将产生深远的影响。例如,AI可以为学生提供循环讲解,这对于教育帮助是巨大的。我们期待未来能有更多类似的产品出现,支持更多地方语言,让AI技术更加贴近人们的生活。