内容持续更新中
一家初创公司的研究发现,GPT和其他AI模型在分析美国证券交易委员会备案文件时经常无法正确回答问题。AI模型在金融等受监管行业的应用中性能必须更高才能实际应用。此外,AI模型的非确定性和不确定性也是应…
谷歌近日发布了Gemini 1.5,该模型拥有100万个令牌的上下文窗口,可处理完整书籍甚至电影。然而,在测试中,Gemini 1.5的准确性并不高,特别是在“海底捞针”测试中,其平均准确度仅为60%…
美国AI翻译平台Unbabel周三宣布推出一项由人工智能驱动的翻译服务——Widn.AI,这是该公司的新产品,基于其专有的大型语言模型(LLM)Tower。Unbabel的CEO瓦斯科·佩德罗(Vas…
国际评级机构穆迪正在推出一项新技术,该技术由生成式人工智能支持,目的是帮助员工在分析大量数据和编写报告的过程中节省时间。穆迪为员工提供了来自谷歌云的大型语言模型,可以快速筛选公开文件和公司数据库中的信…
在竞争激烈的市场环境中,戴尔公司(Dell)于本周四发布了2026财年的业绩展望,预计其调整后的毛利率将出现下降。这主要是由于用于生产人工智能(AI)服务器的成本上升所致。此外,戴尔的个人电脑业务在需…
机器学习早已渗透到各种线上服务中,网购便是其中最成功的领域之一。近年来,机器学习被应用于各种网购任务,例如用户查询、浏览记录、评论分析、产品属性提取等等。为了促进机器学习方法的发展,许多基准测试应运而…
在当今科技迅速发展的背景下,大型语言模型(LLM)在多个行业中扮演着重要角色,帮助自动化任务和提升决策效率。然而,在芯片设计等专业领域,这些模型面临着独特的挑战。NVIDIA 最近推出的 ChipAl…
瑞士洛桑联邦理工学院 (EPFL) 的一项最新研究比较了两种主流的大型语言模型 (LLM) 适应性训练方法:上下文学习 (ICL) 和指令微调 (IFT)。研究人员使用 MT-Bench 基准测试来评…
在自然语言处理领域,大型语言模型(LLMs)的发展迅速,已经在多个领域取得了显著的进展。不过,随着模型的复杂性增加,如何准确评估它们的输出就变得至关重要。传统上,我们依赖人类来进行评估,但这种方式既耗…
在快速发展的生成式 AI 领域,Nous Research 团队正在进行一项独特的实验:他们正在利用分布在全球的机器,预训练一款15亿参数的大型语言模型(LLM),这一过程避免了传统上需要在昂贵且耗电…
在当今数字化的时代,搜索引擎的重要性不言而喻。而现在,有一款名为 MindSearch 的开源 AI 搜索引擎框架横空出世,引起了广泛关注。 MindSearch 拥有着强大的性能,号称能与 Perp…
最近,一个名为 “Twitter Personality” 的 AI 代理爆火,上线12天时间吸引400万用户,因为用户只需要输入推特账号名称即可分析推特人格。 这款由 Wordware 开发的工具,…
最新研究揭示,DeepMind的大型语言模型在文本之外的领域,尤其是图像和音频数据的压缩方面表现出色。这项研究将LLMs重新定义为强大的数据压缩器,而不仅仅是文本生成模型。LLMs的性能与数据集大小相…
在自然语言处理领域,长语境理解一直是一个挑战。尽管大型语言模型(LLMs)在多种语言任务上表现出色,但它们在处理超出其上下文窗口大小的文本时常常受限。为了克服这一限制,研究者们一直在努力提升LLMs对…
据站长之家11月9日消息,亚马逊正在秘密开发一个代号为“Olympus”的大型语言模型,参数高达惊人的2万亿个,是OpenAI最新推出的GPT-4参数的两倍。这将使Olympus成为当前公开的模型参数…
在驱动的人工智能时代,大型语言模型(LLM)如 GPT-3和 BERT 对高质量数据的需求日益增加。然而,从网络上手动整理这些数据不仅费时费力,而且常常难以扩展。 这给开发者们带来了不小的挑战,尤其是…
一个名为OpenR的创新开源框架近日问世,旨在解决大型语言模型(LLMs)在复杂推理任务中的短板。这一由伦敦大学学院、利物浦大学、上海交通大学、香港科技大学(广州)和西湖大学研究人员联合开发的框架,通…
OpenAI首席执行官Sam Altman近日在阿斯彭思想节的采访中就备受期待的GPT-5模型发展情况发表了看法,引发业界广泛关注。 尽管许多用户期待OpenAI在其春季更新活动中发布GPT-5,但公…
近日,Meta AI 的研究团队与加州大学伯克利分校及纽约大学的研究人员合作,推出了一种名为思维偏好优化(Thought Preference Optimization, TPO)的方法,旨在提升经过…
近年来,训练大型语言模型(LLM)变得越来越昂贵且复杂,只有少数大型科技公司具备相应的计算资源。不过,谷歌最近推出了一种名为 SALT(小模型辅助大模型训练)的新方法,这一创新可能会彻底改变 AI 训…
自然语言到 SQL(NL2SQL)技术正在快速发展,成为自然语言处理(NLP)领域的一项重要创新。该技术使得用户能够将自然语言查询转化为结构化查询语言(SQL)语句,这一进步极大地方便了缺乏技术背景的…
2025年3月6日,一款名为 **Light-R1-32B** 的全新语言模型正式亮相。这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器,经过特别训练,以其卓越的数学…
一项最新研究表明,利用生成式 AI 模型,特别是大型语言模型(LLM),可以构建一种能够在多种情境下准确模拟人类行为的架构。这项研究成果为社会科学研究提供了一个强大的新工具。 研究人员首先招募了100…
最近,AI 聊天助手可谓是风头无两,ChatGPT、Gemini 等等,各种新产品层出不穷,功能也越来越强大。很多人觉得,这些 AI 小助手聪明又贴心,简直是居家旅行必备神器! 但一项最新的研究却给这…
在这个智能设备无处不在的时代,我们渴望让手机、平板、甚至是智能家居设备拥有更强大的智能处理能力。但是,这些边缘设备的硬件资源有限,特别是内存和计算能力,这限制了大型语言模型(LLMs)在它们上面的部署…
在当前的技术环境下,人工智能(AI)引发了广泛的讨论。德蒙特福特大学的网络安全教授 Eerke Boiten 对此表示,现有的 AI 系统在管理和可靠性方面存在根本性缺陷,因此不应被用于重要应用。 B…
Mistral AI近日宣布推出其最新一代大型语言模型Mistral Large2,这一模型在成本效益、速度和性能方面都取得了显著突破。 模型概况 Mistral Large2是一个拥有1230亿参数…
美国云计算软件公司 Salesforce 的首席执行官马克・贝奥夫(Marc Benioff)近日在《华尔街日报》的《未来一切》播客上表示,人工智能的未来在于自主代理(autonomous agent…