内容持续更新中
《Factorio》是一款复杂的电脑游戏,专注于建造与资源管理,最近成为研究人员评估人工智能能力的新工具。这款游戏能够测试语言模型在规划和构建复杂系统的能力,同时管理多个资源和生产链。 为此,研究团队…
近日,来自图宾根埃利斯研究所、马里兰大学和劳伦斯利弗莫尔国家实验室的研究团队,开发出名为 Huginn 的新型语言模型,该模型采用递归架构,显著提升了推理能力。与传统模型不同,Huginn 无需专门的…
在人工智能领域,语言模型的快速发展引发了语音理解语言模型(SULMs)的广泛关注。近日,西北工业大学 ASLP 实验室发布了开放语音理解模型 OSUM,旨在探索在学术资源有限的情况下,如何有效训练和利…
Mistral AI 近日推出了名为 Saba 的新型语言模型,该模型专注于提升对中东和东南亚地区语言及文化差异的理解。 Saba 模型拥有240亿参数,虽然规模小于许多竞争对手,但 Mi…
斯坦福大学和华盛顿大学的研究团队近日联合发布了一项突破性的AI训练方法,该方法名为S1,其核心理念在于利用极简的测试时缩放技术来显著提升语言模型的推理能力。与以往依赖庞大算力或复杂算法不同,S1方法巧…
日本人工智能公司Sakana AI近日推出了Transformer²,这是一种创新的方法,旨在帮助语言模型更高效地适应多种任务。与现有的人工智能系统不同,Transformer²能够通过两阶段学习过程…
2025年1月20日,上海阶跃星辰智能科技有限公司宣布推出其Step系列语言模型的两款新成员——Step-2mini和Step-2文学大师版。这一举措旨在满足不同创作场景下开发者对语言模型的差异化需求…
谷歌最近发布了一份详细的白皮书,深入探讨了生成式 AI 代理的开发与功能。这份文档阐述了这些智能代理如何利用外部工具,超越传统语言模型的能力,实现更为复杂的任务。 在白皮书中,生成式 AI 代理被定义…
HuggingFace推出了一款名为 “smolagents” 的全新开源库,该库旨在为语言模型赋予更强的智能代理能力。通过简化的代码结构,smolagents 使得用户能够更容易地构建能够执行各种任…
近日,阿里巴巴 Qwen 团队的研究人员推出了一个名为 “PROCESSBENCH” 的新基准测试,旨在衡量语言模型在数学推理中识别过程错误的能力。随着语言模型在复杂推理任务中取得显著进展,这一领域的…
近年来,以ChatGPT为代表的大语言模型掀起了 AI 领域的新浪潮。这些强大的语言模型不仅能理解人类指令,还能制定计划、探索环境并利用工具解决复杂任务,展现出在机器人、个人助理和流程自动化等领域的巨…
熬夜肝文献综述?抓耳挠腮写论文?别慌!AI2的科研大神们带着他们的最新力作OpenScholar来拯救你了!这款科研效率神器,能让文献综述像逛公园一样轻松愉快! OpenScholar的最大秘密武器,…
在人工智能领域,规模越大似乎就意味着能力越强。为了追求更强大的语言模型,各大科技公司都在疯狂堆叠模型参数和训练数据,结果却发现成本也随之水涨船高。难道就没有一种既经济又高效的方法来训练语言模型吗? 来…
据报道,人工智能巨头 OpenAI 正在与加利福尼亚州和特拉华州的监管机构进行初步谈判,计划将公司结构转变为营利性。这家公司以 ChatGPT 闻名,目前的估值达到1570亿美元。根据彭博社的消息,O…
最近,OpenAI 发布了一个名为 SimpleQA 的新基准测试,旨在评估语言模型生成回答的事实准确性。 随着大型语言模型的快速发展,确保生成内容的准确性面临着诸多挑战,尤其是那些所谓的 “幻觉” …
你是否曾为AI模型庞大的计算资源需求而烦恼?是否希望拥有一个既强大又高效的语言模型来提升工作效率?Zamba2-7B,这款由Zyphra团队开发的7B规模语言模型,或许能为你带来惊喜。 你的AI效率困…
智源研究院推出了一个名为Infinity-Instruct的千万级指令微调数据集,旨在提升语言模型在对话等方面的性能。近日,Infinity Instruct完成了新一轮迭代,包括Infinity-I…
通义千问团队宣布,继Qwen2发布三个月后,Qwen家族的最新成员——Qwen2.5系列语言模型正式开源。这标志着可能是历史上最大规模的开源发布之一,包括了通用语言模型Qwen2.5,以及专门针对编程…
Arcee AI 今天推出了 SuperNova,这是一个为企业提供部署、具有先进指令遵循能力和完全定制选项的700亿参数语言模型。该模型旨在为企业数据隐私、模型稳定性和定制化方面提供强大、可拥有的替…
今天要和大家分享的是一个令人兴奋的 AI 平台—— Not Diamond。在这个平台上,你可以免费使用一系列顶尖的大模型,比如 ChatGPT、Claude、Gemini 和 Llama,这些强大的…
在当今这个科技迅猛发展的时代,语言模型已经成为我们生活中不可或缺的工具。从帮助教师制定课程计划,到回答税务法律的问题,再到预测患者出院前的死亡风险,这些模型的应用领域可谓广泛。 然而,随着它们在决策中…
在信息泛滥的时代,推荐系统成为了我们筛选信息的重要助手。但是,你是否曾因为推荐内容不合口味而感到失望?或者在使用新应用时,推荐系统似乎总是无法精准把握你的需求?现在,EasyRec 的出现,或许能够解…
在人工智能的世界里,有一群特殊的"画家"——Transformer模型中的层级结构。它们像一支支神奇的画笔,在语言的画布上描绘出丰富多彩的世界。最近,一篇名为"Trans…
在人工智能的世界里,语言模型如同一个深不可测的黑箱,我们投入文字,它吐出意义。但在这个过程中,究竟发生了什么?Google DeepMind的最新研究——Gemma Scope,为我们揭开了这个黑箱的…
最近,Zyphra 公司发布了全新的 Zamba2-2.7B 语言模型,这一发布在小型语言模型的发展史上具有重要意义。新模型在性能和效率方面取得了显著提升,它的训练数据集达到了大约3万亿个标记,这使得…
就在不久前的谷歌I/O柏林大会上,谷歌宣布开源其最新语言模型Gemma2,该模型在性能和效率方面取得了重大突破。Gemma2提供9B和27B两种参数规模的版本,其中27B版本的性能已经接近参数量为70…
根据站长之家报道,最新调查显示,32% 的组织已在企业应用中部署生成式人工智能。安全问题是最大关注点,而 58% 的组织主要采用 OpenAI 的 GPT-4 语言模型。数据还显示,75% 的组织正在…
UC 伯克利分校的研究团队开发的语言模型系统在预测领域取得重大突破,接近甚至超越了人类平均水平。他们利用大规模数据和快速处理能力自动化了关键的预测过程,展现出潜在的高准确性。研究结果显示系统在测试集上…