内容持续更新中
在 AI 时代,大型语言模型(LLM)就像武林秘籍,其训练过程耗费巨大算力、数据,就像闭关修炼多年的武林高手。而开源模型的发布,就像高手将秘籍公之于众,但会附带一些许可证(如 Apache2.0和 L…
谷歌推出全新的开源模型系列「Gemma」,Gemma 与 Llama 2、Mistral 相比表现出色,具有独特的设计原则。Gemma 使用GeGLU激活函数,参数规模较大但能够取代其他开源模型,展示…
最近,Facebook母公司Meta发布了新一代大语言模型Llama 2,在处理长文本和复杂任务上优于此前的GPT-3.5 Turbo和Claude 2。Llama 2于2022年7月面世,提供了70…
日本人工智能初创公司 ELYZA 发布了一款基于 Meta 的 Llama 2 的日本语言模型,参数量达到 70 亿,性能与 GPT3.5 相媲美。该模型经过追加事前学习和独特的事后学习,获得了 5 …