近日,Google 宣布推出一款名为 DolphinGemma 的大型语言模型,旨在帮助科学家们更深入地理解海豚的交流方式。这项新技术由 Gemini2.5Pro Experimental 驱动,并与佐治亚理工学院及其野生海豚项目(WDP)紧密合作。WDP 的目标是通过长时间的非侵入式观察,记录和分析大西洋斑点海豚(Stenella frontalis)的自然行为和社会结构,特别是它们的交流模式。
多年来,WDP 积累了大量的数据,能够将特定的海豚声音与它们的行为进行关联。例如,母海豚和小海豚团聚时会发出的独特口哨声、在争斗时发出的尖叫声,以及追逐鲨鱼时常用的 “嗡嗡” 声等。Google 表示,分析海豚复杂的交流方式是一项挑战,而 WDP 的数据为人工智能的应用提供了绝佳机会。
图源备注:图片由AI生成,图片授权服务商Midjourney
DolphinGemma 正是基于这一数据开发的。该模型采用 Google 的 SoundStream 分词器,将海豚的声音拆解成可管理的音频单元。整个系统的架构设计旨在理解复杂的声音序列,包含约4亿个参数,能够在 WDP 研究人员的 Pixel 手机上原生运行。
与传统的机器学习模型不同,DolphinGemma 专注于音频输入和输出,接收海豚的自然声音,并通过一种类似大型语言模型理解人类语音的方法,预测下一个最可能的声音。这一过程可以类比为为海豚 “自动完成” 交流的功能。DolphinGemma 能够识别海豚声音的模式和结构,为科学家们提供更多的研究可能。
此外,在 DolphinGemma 推出之前,鲸鱼听觉增强遥测技术(CHAT)团队也在探索海豚双向交流的可能性。CHAT 的目标并非完全破解海豚语言,而是创建一个简单易用的互动词汇。通过将合成的声音与海豚偏好的特定物体(如马尾藻、海草等)关联,研究团队希望海豚能学会模仿这些声音,主动 “索要” 这些物品。
Google 表示,DolphinGemma 将于今年夏天作为开放模型发布,旨在为全球研究人员提供工具,帮助他们挖掘自己的声学数据集,从而更好地理解这些智慧的海洋哺乳动物。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则