内容持续更新中
昆仑万维表示,其自研的天工大模型在 Benchmark GSM8K 测试中取得了 80% 的正确率,超过了 GPT-3.5 和 LLaMA2-70B,达到了全球领先水平,接近于 GPT-4。天工大模型…
站长之家报道,Colossal-AI团队通过词表扩充、数据筛选和多阶段训练策略,在15小时内用几千元成本训练出参数规模达85亿字元的中文版LLaMA2大模型。这个低成本方案使中文版LLaMA2在多项中…
最近清华大学的研究团队针对提升LLM智能体能力的问题,提出了AgentTuning方法。该方法包含构建AgentInstruct智能体数据集和采用混合指令微调策略。作者利用AgentTuning对Ll…
Meta AI的研究员Thomas Scialom最近在一次采访中分享了一些关于他们最新项目Llama3的见解。他直言不讳地指出,网络上的大量文本质量参差不齐,他认为在这些数据上进行训练是一种资源浪费…
据《福布斯》报道,Meta(前称 Facebook)正在积极洽谈收购一家名为 FuriosaAI 的韩国芯片初创公司。此举旨在增强 Meta 的人工智能硬件基础设施,以应对日益增长的 AI 需求。Fu…