内容持续更新中
美国商务部发布了一份报告,表达了对 “开放权重” 生成 AI 模型的支持,比如 Meta 的 Llama3.1。这份报告指出,开放模型能够使小公司、研究人员、非营利组织和个人开发者更容易获取生成 AI…
亚马逊云科技宣布在Amazon Bedrock上提供Llama3.1模型,这是Meta开发的先进、强大的AI模型系列。Llama3.1模型包含8B、70B和405B三种参数量的模型,它们在广泛的行业基…
3月10日,鸿海富士康在技术创新的道路上迈出了重要一步,正式推出其首款 AI 推理大模型 “FoxBrain”。这一模型不仅是富士康的自我突破,更标志着台湾省地区在 AI 推理领域的崭新起点。富士康表…
中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1,在多项基准测试中的表现也优于包括…
IBM 正式发布了其新一代开源大语言模型 Granite3.1,力图在企业级 AI 领域占据领先地位。这一系列模型具备128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。 IB…
智源研究院推出了一个名为Infinity-Instruct的千万级指令微调数据集,旨在提升语言模型在对话等方面的性能。近日,Infinity Instruct完成了新一轮迭代,包括Infinity-I…
刚刚登场不久的开源 AI 模型 Reflection70B,近日就遭到了业界的广泛质疑。 这款由纽约初创公司 HyperWrite 发布的模型,自称是 Meta 公司的 Llama3.1变种,曾以其在…
人工智能初创公司HyperWrite的首席执行官Matt Shumer宣布了一个重要的里程碑:他们推出了基于Meta开源Llama3.1-70B Instruct的Reflection70B模型。这款…
性能 AI 计算领域的先驱 Cerebras Systems 推出了一种开创性的解决方案,该解决方案将彻底改变 AI 推理。2024年8月27日,该公司宣布推出 Cerebras Inference,…
一个仅有10人的小团队,竟然敢挑战科技巨头Meta的地位,这简直就是现实版的"大卫战胜歌利亚"! 这个名叫Nous Research的初创公司可不是什么无名之辈。他们刚刚推出的He…
最近,一项新研究令人振奋,证明了大型语言模型(LLM)可以通过搜索功能来显著提升性能。特别是,参数量仅8亿的 Llama3.1模型经过100次搜索,竟然在 Python 代码生成的任务上与 GPT-4…
在人工智能的世界里,开源与闭源的较量从未停歇。而今,Meta AI的Llama3.1模型的发布,似乎为这场较量画上了分水岭。这不仅仅是一个模型的发布,更是开源AI走向成熟的标志,预示着一个全新的时代即…
最近,Meta 推出了一款名为 Prompt-Guard-86M 的机器学习模型,旨在检测和应对提示注入攻击。这类攻击通常是通过特殊的输入,让大型语言模型(LLM)表现得不当或者规避安全限制。不过,令…
在人工智能的世界里,每一次突破都伴随着令人瞠目结舌的数据。想象一下,16384块GPU同时运转,这不是科幻电影里的场景,而是Meta公司在训练最新Llama3.1模型时的真实写照。然而,在这场技术盛宴…
Meta的科学家Thomas Scialom在播客节目Latent Space中,为我们揭开了Llama3.1的研发秘籍,并提前透露了Llama4的神秘面纱。 Llama3.1的诞生,是参数规模、训练…
当Llama3.1开源的消息还在耳边回响,OpenAI又来抢风头了。从现在起,每天200万训练token免费微调模型,直到9月23日。这不仅是对开发者的慷慨解囊,更是对AI技术进步的一次大胆推动。 G…
Meta最近发布了新一代开源模型系列Llama3.1,其中包括一个405B参数的版本,其性能接近甚至在某些基准测试中超越了GPT-4等闭源模型。Llama3.1-8B-Instruct是该系列中的一个…
继昨天Meta宣布发布最强开源模型Llama3.1之后,Mistral AI在今天凌晨 隆重推出了其旗舰模型 Mistral Large2,这一新产品有 1230亿个参数,拥有超大的128k…
昨晚,Meta公司宣布开源其最新大语言模型Llama3.1 405B。这一重磅消息标志着经过一年的精心筹备,从项目规划到最终审核,Llama3系列模型终于与公众见面。 Llama3.1405B是一个具…
Meta公司首席执行官马克·扎克伯格近日宣布了Llama3.1的正式发布,并表示这可能是开源AI领域的一个重要里程碑。 Meta此次推出了三个不同规模的Llama3.1模型,其中最引人注目的是拥有40…