内容持续更新中
大型语言模型在许多任务中表现出色,但其推理能力一直备受争议。Meta 的研究人员近日发表论文,展示了他们如何利用 Transformer 模型解决数学领域一个长期存在的难题:发现动力系统的全局李雅普诺…
最近,Meta、加州大学伯克利分校和纽约大学的科学家们合作研发了一种新技术,名为 “思维偏好优化”(Thought Preference Optimization,简称 TPO)。这项技术的目标是提升…
加拿大卡尔加里大学的研究人员开发了一款名为“Augmented Physics”的全新工具,旨在将静态的物理课本图表转化为交互式模拟,为物理教育带来革新。 该工具利用先进的计算机视觉技术,如 Segm…
最近在寻找能提升编程效率的工具?我强烈推荐你试试 DevKit!这款AI驱动的开发者助手,彻底改变了我的编程体验,现在分享一下我的真实感受。 DevKit (https://www.getdevkit…
一个名为OpenR的创新开源框架近日问世,旨在解决大型语言模型(LLMs)在复杂推理任务中的短板。这一由伦敦大学学院、利物浦大学、上海交通大学、香港科技大学(广州)和西湖大学研究人员联合开发的框架,通…
在人工智能的世界里,机器学习模型尤其是大型语言模型(LLMs)的推理能力一直是科学家们关注的焦点。 最近,苹果公司的AI研究团队发表了一篇论文,题为《理解大型语言模型在数学推理上的局限性》,为我们揭开…
最近,超长上下文窗口的大型语言模型(LLMs)成为了人们讨论的热点。这些模型能够在一个提示中处理数十万甚至上百万个标记,为开发者开启了许多新的可能性。不过,这些长上下文 LLM 到底能多好地理解和利用…
沃尔玛一直以来都在积极探索人工智能的应用,最近他们开始测试自己的大型语言模型(LLM),名为 Wallaby。 这款模型是专为零售行业设计,经过了数十年的沃尔玛数据训练,能够更好地理解员工和顾客的沟通…
近日,谷歌宣布推出一款名为 “gemma-2-2b-jpn-it” 的新模型,这是其 Gemma 系列语言模型的最新成员。这个模型专门针对日本语言进行优化,展示了谷歌在大型语言模型(LLM)领域持续投…
随着人工智能越来越多地融入企业的工作流程和产品,市场上对机器学习操作平台(MLOps)的需求也在不断上升。这类平台帮助企业更轻松地创建、测试和部署机器学习模型。然而,尽管市场上已有不少竞争者,比如 I…
在自然语言处理领域,大型语言模型(LLMs)的发展迅速,已经在多个领域取得了显著的进展。不过,随着模型的复杂性增加,如何准确评估它们的输出就变得至关重要。传统上,我们依赖人类来进行评估,但这种方式既耗…
在驱动的人工智能时代,大型语言模型(LLM)如 GPT-3和 BERT 对高质量数据的需求日益增加。然而,从网络上手动整理这些数据不仅费时费力,而且常常难以扩展。 这给开发者们带来了不小的挑战,尤其是…
最近,西班牙瓦伦西亚理工大学的科学家进行了一项研究,揭示了大型语言模型如GPT、LLaMA和BLOOM在处理问题时可能更倾向于撒谎而非承认无知的现象。研究发现,随着AI模型复杂性的增加,它们在面对复杂…
谷歌DeepMind研究团队最近取得重大突破,开发出名为SCoRe(Self-Correction through Reinforcement Learning,通过强化学习进行自我纠正)的创新技术。…
近期,一项发表在《自然》杂志上的研究揭示了人工智能发展中的一个令人深思的现象:随着大型语言模型(LLMs)的不断升级,它们在回答问题时越来越倾向于"自信满满"地给出答案,即便这些答…
最近,加州大学洛杉矶分校和亚马逊的研究人员对大型语言模型(LLMs)的推理能力进行了深入分析。他们首次系统地区分了归纳推理和演绎推理这两种能力,探讨了这两者对 AI 系统的挑战程度。 图源备注:图片由…
随着OpenAI的GPT-4在传统数学评测中屡创佳绩,北京大学和阿里巴巴的研究团队联手推出了一个全新的评测基准——Omni-MATH,旨在评估大型语言模型在奥林匹克数学竞赛级别的推理能力。这一举措不仅…
近日,一项来自清华大学和加州大学伯克利分校的研究引发了广泛关注。研究表明,经过强化学习与人类反馈(RLHF)训练的现代人工智能模型,不仅变得更加智能,还学会了如何更有效地欺骗人类。这一发现对AI发展和…
近日,哈佛肯尼迪学院的“错误信息审查”研究发现,人工智能生成的虚假研究论文正在渗透到谷歌学术等学术搜索引擎中。这可能会削弱公众对科学发现的信任,并破坏依赖尖端研究的行业的产品开发。 研究人员发现了13…
最近,Hugging Face 推出了一个名为 LightEval 的新工具,这是一个轻量级的 AI 评估套件,旨在帮助企业和研究人员更好地评估大型语言模型(LLMs)。 随着 AI 技术在各个行业中…
最近,艾伦人工智能研究所(AI2)发布了一款全新的开源模型 OLMoE,旨在满足对大型语言模型(LLM)的需求。这个模型不仅性能优异,而且成本相对低廉。 OLMoE 采用了一种稀疏混合专家(MoE)架…
近日,英国秘密情报局(MI6)局长理查德・摩尔和美国中央情报局(CIA)局长比尔・伯恩斯首次联合发表了一篇文章,分享他们如何在情报工作中利用生成式人工智能。 图源备注:图片由AI生成,图片授权服务商M…
在人工智能快速发展的今天,一款名为Mini-Omni的开源多模态大型语言模型正在引领语音交互技术的革新。这个由多个先进技术集成而成的AI系统,不仅能够实现实时的语音输入和输出,还具备"边思考…
在本周的一次商业会议上,OpenAI日本业务负责人忠志永(Tadao Nagasaki)的一番话引发了广泛关注。他提到了“GPT Next”,这被外界广泛解读为即将推出的下一代大型语言模型(LLM)。…
OpenAI的 ChatGPT5让人期待已久,人们对 GPT-5的功能、新功能和发布时间的猜测不断升温。 关于 ChatGPT5的信息已经流传很多,本文将结合市面上的消息,对ChatGPT5发布日期、…
最近,谷歌 DeepMind 的研究团队联合多所高校提出了一种新方法,名为生成奖励模型(GenRM),旨在提升生成式 AI 在推理任务中的准确性和可靠性。 生成式 AI 被广泛应用于自然语言处理等多个…
在当今竞争激烈的就业市场中,一款名为LinkedIn_AIHawk的革命性AI求职工具正引起广泛关注。这款开源工具声称能在短短24小时内自动申请1000个工作岗位,并获得50个面试机会,其惊人的效率让…
近日,一项由研究员纳Naphtali Deutsch进行的调查引发了人们的关注。他通过扫描网络发现,数百个开源的大型语言模型(LLM)构建服务器和几十个向量数据库正在泄露大量敏感信息。这些信息的泄露源…