大型语言模型相关资讯及大型语言模型相关产品 | 第 5 页

首页
标签
大型语言模型
全部文章

大型语言模型

202篇

内容持续更新中

热门

01.AI

1. OCR技术2. PaddleOCR算法模型挑战赛3. 场景文本识别算法SVTRv24. 表格识别算法SLANet-LCNetV2

11x

1200万美元融资

1688

1950

1X 科技

1型糖尿病专病大模型

2小时学习模式

3000亿参数大模型

3000亿美元估值

30B参数模型

360

360公司

360创始人

告别数学家秃头时代？Meta 最新研究：AI 自动发现李雅普诺夫函数，准确率远超人类！

阅读量飙升

大型语言模型在许多任务中表现出色，但其推理能力一直备受争议。Meta 的研究人员近日发表论文，展示了他们如何利用 Transformer 模型解决数学领域一个长期存在的难题:发现动力系统的全局李雅普诺…

七个圈

行业资讯

阅读量飙升

Meta 研究团队推出新方法，让 AI 模型在回答前 “思考”!

最近，Meta、加州大学伯克利分校和纽约大学的科学家们合作研发了一种新技术，名为 “思维偏好优化”（Thought Preference Optimization，简称 TPO）。这项技术的目标是提升…

七个圈

行业资讯

阅读量飙升

物理课本竟然“活”了！Augmented Physics让静态图表秒变动图

加拿大卡尔加里大学的研究人员开发了一款名为“Augmented Physics”的全新工具，旨在将静态的物理课本图表转化为交互式模拟，为物理教育带来革新。该工具利用先进的计算机视觉技术，如 Segm…

七个圈

精选视频

阅读量飙升

DevKit：开发者必备的AI编程助手，效率提升神器！

最近在寻找能提升编程效率的工具？我强烈推荐你试试 DevKit！这款AI驱动的开发者助手，彻底改变了我的编程体验，现在分享一下我的真实感受。 DevKit (https://www.getdevkit…

七个圈

行业资讯

阅读量飙升

创新开源框架OpenR 有效提升大模型推理能力

一个名为OpenR的创新开源框架近日问世，旨在解决大型语言模型（LLMs）在复杂推理任务中的短板。这一由伦敦大学学院、利物浦大学、上海交通大学、香港科技大学(广州)和西湖大学研究人员联合开发的框架，通…

七个圈

行业资讯

阅读量飙升

苹果AI研究团队发现大模型推理短板一句话就把OpenAI o1干废了

在人工智能的世界里，机器学习模型尤其是大型语言模型（LLMs）的推理能力一直是科学家们关注的焦点。最近，苹果公司的AI研究团队发表了一篇论文，题为《理解大型语言模型在数学推理上的局限性》，为我们揭开…

七个圈

行业资讯

阅读量飙升

DeepMind推新基准Michelangelo：揭示长上下文 LLM推理缺陷

最近，超长上下文窗口的大型语言模型（LLMs）成为了人们讨论的热点。这些模型能够在一个提示中处理数十万甚至上百万个标记，为开发者开启了许多新的可能性。不过，这些长上下文 LLM 到底能多好地理解和利用…

七个圈

行业资讯

阅读量飙升

沃尔玛推出新型人工智能模型 Wallaby，已开启测试

沃尔玛一直以来都在积极探索人工智能的应用，最近他们开始测试自己的大型语言模型（LLM），名为 Wallaby。这款模型是专为零售行业设计，经过了数十年的沃尔玛数据训练，能够更好地理解员工和顾客的沟通…

七个圈

行业资讯

阅读量飙升

谷歌推出 Gemma-2-JPN：一款针对日本市场的先进 AI 语言模型

近日，谷歌宣布推出一款名为 “gemma-2-2b-jpn-it” 的新模型，这是其 Gemma 系列语言模型的最新成员。这个模型专门针对日本语言进行优化，展示了谷歌在大型语言模型（LLM）领域持续投…

七个圈

行业资讯

阅读量飙升

韩国VESSL AI 获 1200 万美元融资，可使企业 GPU 成本降低多达 80%

随着人工智能越来越多地融入企业的工作流程和产品，市场上对机器学习操作平台（MLOps）的需求也在不断上升。这类平台帮助企业更轻松地创建、测试和部署机器学习模型。然而，尽管市场上已有不少竞争者，比如 I…

七个圈

行业资讯

阅读量飙升

Salesforce AI 推全新大语言模型评估家族SFR-Judge 基于Llama3构建

在自然语言处理领域，大型语言模型（LLMs）的发展迅速，已经在多个领域取得了显著的进展。不过，随着模型的复杂性增加，如何准确评估它们的输出就变得至关重要。传统上，我们依赖人类来进行评估，但这种方式既耗…

七个圈

行业资讯

阅读量飙升

全新开源爬虫工具Crawl4AI：极速抓取网页内容并进行数据提取

在驱动的人工智能时代，大型语言模型（LLM）如 GPT-3和 BERT 对高质量数据的需求日益增加。然而，从网络上手动整理这些数据不仅费时费力，而且常常难以扩展。这给开发者们带来了不小的挑战，尤其是…

七个圈

行业资讯

阅读量飙升

研究发现:大型语言模型可能更倾向于撒谎而非承认无知

最近，西班牙瓦伦西亚理工大学的科学家进行了一项研究，揭示了大型语言模型如GPT、LLaMA和BLOOM在处理问题时可能更倾向于撒谎而非承认无知的现象。研究发现，随着AI模型复杂性的增加，它们在面对复杂…

七个圈

行业资讯

阅读量飙升

谷歌DeepMind推出SCoRe：大型语言模型自我纠正新技术

谷歌DeepMind研究团队最近取得重大突破，开发出名为SCoRe（Self-Correction through Reinforcement Learning，通过强化学习进行自我纠正）的创新技术。…

七个圈

行业资讯

阅读量飙升

AI聊天机器人越来越 “自信”，但它们的答案可得打个问号！

近期，一项发表在《自然》杂志上的研究揭示了人工智能发展中的一个令人深思的现象:随着大型语言模型（LLMs）的不断升级，它们在回答问题时越来越倾向于"自信满满"地给出答案，即便这些答…

七个圈

行业资讯

阅读量飙升

研究发现，AI语音模型在归纳推理中表现出色，在演绎任务中“碰壁”

最近，加州大学洛杉矶分校和亚马逊的研究人员对大型语言模型（LLMs）的推理能力进行了深入分析。他们首次系统地区分了归纳推理和演绎推理这两种能力，探讨了这两者对 AI 系统的挑战程度。图源备注：图片由…

七个圈

行业资讯

阅读量飙升

北大阿里联手推出Omni-MATH：AI数学能力的终极挑战

随着OpenAI的GPT-4在传统数学评测中屡创佳绩，北京大学和阿里巴巴的研究团队联手推出了一个全新的评测基准——Omni-MATH，旨在评估大型语言模型在奥林匹克数学竞赛级别的推理能力。这一举措不仅…

七个圈

行业资讯

阅读量飙升

AI学会撒谎？清华伯克利研究揭示RLHF训练的惊人后果

近日，一项来自清华大学和加州大学伯克利分校的研究引发了广泛关注。研究表明，经过强化学习与人类反馈（RLHF）训练的现代人工智能模型，不仅变得更加智能，还学会了如何更有效地欺骗人类。这一发现对AI发展和…

七个圈

行业资讯

阅读量飙升

专家称人工智能产生的垃圾科学研究问题日益严重

近日，哈佛肯尼迪学院的“错误信息审查”研究发现，人工智能生成的虚假研究论文正在渗透到谷歌学术等学术搜索引擎中。这可能会削弱公众对科学发现的信任，并破坏依赖尖端研究的行业的产品开发。研究人员发现了13…

七个圈

行业资讯

阅读量飙升

AI 评估不再难！Hugging Face 推出 LightEval，让你轻松掌控模型表现！

最近，Hugging Face 推出了一个名为 LightEval 的新工具，这是一个轻量级的 AI 评估套件，旨在帮助企业和研究人员更好地评估大型语言模型（LLMs）。随着 AI 技术在各个行业中…

七个圈

行业资讯

阅读量飙升

AI2 推出全新开源模型 OLMoE：高效、强大且不再昂贵！

最近，艾伦人工智能研究所（AI2）发布了一款全新的开源模型 OLMoE，旨在满足对大型语言模型(LLM)的需求。这个模型不仅性能优异，而且成本相对低廉。 OLMoE 采用了一种稀疏混合专家（MoE）架…

七个圈

行业资讯

阅读量飙升

英美情报首脑首次携手:用生成式 AI 技术应对科技威胁

近日，英国秘密情报局（MI6）局长理查德・摩尔和美国中央情报局(CIA)局长比尔・伯恩斯首次联合发表了一篇文章，分享他们如何在情报工作中利用生成式人工智能。图源备注：图片由AI生成，图片授权服务商M…

七个圈

行业资讯

阅读量飙升

Mini-Omni：开启"边思考边说话"新时代的多模态AI模型

在人工智能快速发展的今天，一款名为Mini-Omni的开源多模态大型语言模型正在引领语音交互技术的革新。这个由多个先进技术集成而成的AI系统，不仅能够实现实时的语音输入和输出，还具备"边思考…

七个圈

精选视频

阅读量飙升

OpenAI日本负责人暗示将推下一代模型“GPT Next”？OpenAI 澄清：只是比喻

在本周的一次商业会议上，OpenAI日本业务负责人忠志永（Tadao Nagasaki）的一番话引发了广泛关注。他提到了“GPT Next”，这被外界广泛解读为即将推出的下一代大型语言模型(LLM)。…

七个圈

行业资讯

阅读量飙升

ChatGPT 5最全预测可能就在这里了：发布日期、功能和价格

OpenAI的 ChatGPT5让人期待已久，人们对 GPT-5的功能、新功能和发布时间的猜测不断升温。关于 ChatGPT5的信息已经流传很多，本文将结合市面上的消息，对ChatGPT5发布日期、…

七个圈

行业资讯

阅读量飙升

谷歌DeepMind新方法GenRM 一举提升AI推理能力，准确率飙升

最近，谷歌 DeepMind 的研究团队联合多所高校提出了一种新方法，名为生成奖励模型（GenRM），旨在提升生成式 AI 在推理任务中的准确性和可靠性。生成式 AI 被广泛应用于自然语言处理等多个…

七个圈

行业资讯

阅读量飙升

AI求职神器横空出世：24小时内自动投1000份简历，50场面试在握

在当今竞争激烈的就业市场中，一款名为LinkedIn_AIHawk的革命性AI求职工具正引起广泛关注。这款开源工具声称能在短短24小时内自动申请1000个工作岗位，并获得50个面试机会，其惊人的效率让…

七个圈

行业资讯

阅读量飙升

问题很严重！数百个开源LLM服务器泄露企业和健康敏感数据

近日，一项由研究员纳Naphtali Deutsch进行的调查引发了人们的关注。他通过扫描网络发现，数百个开源的大型语言模型（LLM）构建服务器和几十个向量数据库正在泄露大量敏感信息。这些信息的泄露源…

七个圈

行业资讯

贡献榜

贡献文章数

七个圈AIGC破圈俱乐部欢迎您！

8.8万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.1万用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

5.7万用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.3万用户在看

大型语言模型

202篇

贡献榜

七个圈

创米

AI情报

AI领航员

搜索

近期热门

七个圈AIGC破圈俱乐部欢迎您！

8.8万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.1万 用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

5.7万 用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.3万 用户在看

大型语言模型

202篇

贡献榜

七个圈

创米

AI情报

AI领航员

8.8万用户在看

7.1万用户在看

5.7万用户在看

5.3万用户在看