内容持续更新中
在最新的研究中,谷歌与卡内基梅隆大学及 MultiOn 团队联手,探讨了合成数据对大型模型的训练效果。他们发现,合成数据能够显著提升大模型在逻辑推理方面的表现,尤其是在数学问题的解决能力上,提升幅度达…
当地时间周一,Mistral 在巴黎发布了一款名为 Mistral Saba 的大模型,其核心特色是专门优化的阿拉伯语交互能力。这一创新举措被视为欧洲 AI 领域的重要突破。 Mistral Saba…
Hugging Face今天发布了SmolLM2,一组新的紧凑型语言模型,实现了令人印象深刻的性能,同时所需的计算资源比大型模型少得多。新模型采用Apache2.0许可发布,有三种大小——135M、3…