大型语言模型相关资讯及大型语言模型相关产品 | 第 6 页

首页
标签
大型语言模型
全部文章

大型语言模型

202篇

内容持续更新中

热门

01.AI

1. OCR技术2. PaddleOCR算法模型挑战赛3. 场景文本识别算法SVTRv24. 表格识别算法SLANet-LCNetV2

11x

1200万美元融资

1688

1950

1X 科技

1型糖尿病专病大模型

2小时学习模式

3000亿参数大模型

3000亿美元估值

30B参数模型

360

360公司

360创始人

阅读量飙升

智谱AI：GLM-4-Flash大模型API接口免费向公众开放

北京智谱华章科技有限公司近期宣布，将旗下GLM-4-Flash大型语言模型的API接口免费向公众开放，以推动大型模型技术的普及和应用。 GLM-4-Flash模型在速度和性能上都展现出显著的优势，特别…

七个圈

行业资讯

阅读量飙升

美国22%顶级公司财报提到生成式AI，却多是担忧和风险

最近的一项分析显示，越来越多的美国财富500强公司在财务报告中提到了生成性人工智能（AI），不过提到的内容并不全是积极向上的。根据 Arize 的研究，自2022年以来，这类提及的数量增加了250%…

七个圈

行业资讯

阅读量飙升

Llama 8B 用搜索引擎打败GPT-4o？新发现颠覆了AI界的游戏规则！

最近，一项新研究令人振奋，证明了大型语言模型（LLM）可以通过搜索功能来显著提升性能。特别是，参数量仅8亿的 Llama3.1模型经过100次搜索，竟然在 Python 代码生成的任务上与 GPT-4…

七个圈

行业资讯

阅读量飙升

Claude推出"提示缓存"功能允许开发人员在API上缓存常用上下文

8月14日，Anthropic公司宣布为其Claude系列大型语言模型推出一项名为"提示缓存"的新功能，声称能大幅降低企业使用AI的成本，同时提升性能。但这项功能究竟是否能如公司所…

七个圈

行业资讯

阅读量飙升

研究发现，ChatGPT自动提示重写会降低 DALL-E 3 的性能

最近，加州大学伯克利分校的一项研究显示，由大型语言模型（LLM）进行的自动提示修改，会显著降低 DALL-E3生成图像的质量。该研究对1，891名参与者进行了一项在线实验，目的是探讨这种自动重写对图像…

七个圈

行业资讯

阅读量飙升

ChatGPT神秘力量拖LLM后腿？Karpathy与LeCun联合批评RLHF技术

近日，AI界的知名研究员Andrej Karpathy抛出了一个颇具争议的观点，他认为目前广受推崇的基于人类反馈的强化学习（RLHF）技术可能并非通往真正人类级别问题解决能力的必由之路。这一言论无疑给…

七个圈

行业资讯

阅读量飙升

手机跑大模型速度快5倍！微软亚研院开源新技术 CPU上也能享受极速体验

在这个智能设备无处不在的时代，我们渴望让手机、平板、甚至是智能家居设备拥有更强大的智能处理能力。但是，这些边缘设备的硬件资源有限，特别是内存和计算能力，这限制了大型语言模型（LLMs）在它们上面的部署…

七个圈

行业资讯

阅读量飙升

AI代理工具Twitter Personality爆火：斩获400万用户、输入账号名称即可分析推特人格

最近，一个名为 “Twitter Personality” 的 AI 代理爆火，上线12天时间吸引400万用户，因为用户只需要输入推特账号名称即可分析推特人格。这款由 Wordware 开发的工具，…

七个圈

行业资讯

阅读量飙升

阿里开源最新数学模型Qwen2-Math 数学能力秒杀GPT-4o

近日，阿里云重磅推出了Qwen2-Math系列大型语言模型，这一专注于数学领域的AI新秀一经亮相就引发了业界的广泛关注。作为Qwen2系列的最新成员，Qwen2-Math和Qwen2-Math-In…

七个圈

行业资讯

阅读量飙升

律师称美国网络安全法过于模糊，无法保护AI安全研究人员

在现代科技飞速发展的今天，人工智能尤其是大型语言模型（LLMs）正逐渐成为焦点。然而，美国的网络安全法律似乎跟不上这个快速变化的领域。最近，哈佛大学的一组学者在黑帽大会上指出，现行的《计算机欺诈和滥用…

七个圈

行业资讯

阅读量飙升

北大/通研院发布超难基准LooGLE测试长文本理解大模型全军覆没！

在自然语言处理领域，长语境理解一直是一个挑战。尽管大型语言模型（LLMs）在多种语言任务上表现出色，但它们在处理超出其上下文窗口大小的文本时常常受限。为了克服这一限制，研究者们一直在努力提升LLMs对…

七个圈

行业资讯

阅读量飙升

Meta推“自学评估器”: 无需人工注释NLP模型评估，优于 GPT-4 等常用的LLM

在当今时代，自然语言处理（NLP）领域发展迅速，大型语言模型(LLMs)能够高精度地执行复杂的语言相关任务，为人机交互带来了更多可能。然而，NLP 中存在一个显著问题，那就是模型评估对人类注释的依赖。…

七个圈

行业资讯

阅读量飙升

英伟达地位不保？图灵奖得主LeCun加盟Groq，后者估值28亿美金

Groq在最新一轮融资中成功募集6.4亿美元，由全球最大资产管理公司BlackRock Inc.的基金领投，同时获得了科技巨头思科和韩国电子巨擘三星投资部门的鼎力支持。这轮融资让Groq的估值一举飙…

七个圈

行业资讯

阅读量飙升

媲美Perplexity！MindSearch：模仿人类思维AI搜索引擎 3分钟整合300个网页信息

在当今数字化的时代，搜索引擎的重要性不言而喻。而现在，有一款名为 MindSearch 的开源 AI 搜索引擎框架横空出世，引起了广泛关注。 MindSearch 拥有着强大的性能，号称能与 Perp…

七个圈

行业资讯

阅读量飙升

港大与MIT联手打造ItiNera：你的私人AI导游，一键规划完美Citywalk路线！

在都市的喧嚣中，每个人都渴望一场说走就走的citywalk，穿梭于大街小巷，探索历史遗迹，沉浸在当地文化之中。然而，规划一场令人满意的城市漫步并非易事，它需要考虑旅行信息的收集、兴趣点（POI）的选择…

七个圈

行业资讯

阅读量飙升

清华推出短视频AI理解新技术video-SALMONN 像人一样刷视频

最近，新加坡国立大学的Wenyi Yu及其团队提出了一项名为video-SALMONN的新技术，它不仅能够理解视频中的视觉帧序列、音频事件和音乐，更重要的是，它能够理解视频中的语音内容。这项技术的提出…

七个圈

行业资讯

阅读量飙升

AI离人类有多远？一个晾衣问题暴露GPT-4致命缺陷

在Quanta Magazine的播客中，华盛顿大学计算机教授Yejin Choi与主持人Steven Strogatz展开了一场关于人工智能的深刻对话。他们探讨了AI是否必须具备身体和情感，才能发展…

七个圈

行业资讯

阅读量飙升

媲美GPT-4o！复旦推语音模型SpeechGPT2 能听懂你的喜怒哀乐

在人工智能的世界里，大型语言模型（LLM）已经成为推动自然语言处理(NLP)任务的关键力量。然而，要让这些模型真正理解并生成跨模态内容，如语音和文本，我们还有很长的路要走。复旦大学的研究团队在论文&q…

七个圈

行业资讯

阅读量飙升

Mistral AI发布大型语言模型Mistral Large 2 接近Llama 405B

Mistral AI近日宣布推出其最新一代大型语言模型Mistral Large2，这一模型在成本效益、速度和性能方面都取得了显著突破。模型概况 Mistral Large2是一个拥有1230亿参数…

七个圈

行业资讯

阅读量飙升

微软Q-Sparse模型：8B参数性能直逼7B模型训练微调轻松搞定！

在人工智能的世界里，大型语言模型（LLMs）以其卓越的自然语言处理能力而著称。然而，这些模型在实际应用中的部署却面临着巨大的挑战，主要是因为它们在推理阶段的高计算成本和内存占用。为了解决这一问题，研究…

七个圈

行业资讯

阅读量飙升

Cohere与富士通合作推出日语大语言模型“Takane” 提升企业效率

加拿大企业AI初创公司Cohere与日本信息技术巨头富士通近日宣布达成战略合作，计划共同推出名为“Takane”的日语大型语言模型（LLM）。该合作旨在为企业提供强大的日语语言模型解决方案，提升客户与…

七个圈

行业资讯

阅读量飙升

大语言模型推理能力被高估了在不熟悉场景中有很大的弱点

近期，麻省理工学院（MIT）的研究团队对大型语言模型(LLMs)进行了深入的研究，探讨它们在不同任务下的表现。他们发现，尽管这些模型在一些常见的任务上看起来很出色，但实际上它们的推理能力常常被高估，尤…

七个圈

行业资讯

阅读量飙升

Poe社交平台推出Previews功能：让AI编程直接可视化

站长之家(ChinaZ.com) 7月9日消息:Poe日前推出了一项名为Previews的创新功能，为用户带来前所未有的交互体验。该功能允许用户在聊天过程中直接查看和操作由AI生成的Web应用程序，…

七个圈

行业资讯

阅读量飙升

IBM公布了其完整的6.48 TB LLM训练数据集

IBM 于五月份开源了适用于企业应用场景的 Granite13B LLM 模型。现在，IBM 的 AI 平台产品副总裁阿曼德・鲁伊兹（Armand Ruiz）公开了用于训练 Granite13B 的全…

近十年科学论文分析显示，研究人员发现人工智能模型滥用了一些 “风格” 词汇，而这些词汇在几年前还很少被使用。在一项尚未经同行评审的新研究中，研究人员采用了一种新颖的方法，类似于流行病学，通过分析生物…

七个圈

行业资讯

阅读量飙升

OpenAI CEO 奥特曼透露GPT-5开发进展称将是"重大飞跃"

OpenAI首席执行官Sam Altman近日在阿斯彭思想节的采访中就备受期待的GPT-5模型发展情况发表了看法，引发业界广泛关注。尽管许多用户期待OpenAI在其春季更新活动中发布GPT-5，但公…

七个圈

行业资讯

阅读量飙升

GPT5有望25年底或26年初推出 OpenAI CEO：带来巨大飞跃

近日，在Aspen Ideas Festival的访谈中，OpenAI CEO阿尔特曼坦诚地分享了GPT-5的研发进度与挑战。他强调，尽管团队对此项目充满信心，但通往GPT-5的道路依然漫长且充满未…

七个圈

行业资讯

阅读量飙升

红杉资本领投法国人工智能初创公司Dust 创始人为前 OpenAI 科学家

据彭博社消息，法国初创公司Dust近日宣布完成1600万美元融资，由知名风险投资机构红杉资本领投。Dust专注于为企业定制人工智能机器人，是帮助企业更便捷地使用大型语言模型的新兴公司之一。据悉，Du…

七个圈

行业资讯

贡献榜

贡献文章数

七个圈AIGC破圈俱乐部欢迎您！

8.8万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.1万用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

5.7万用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.3万用户在看

大型语言模型

202篇

贡献榜

七个圈

创米

AI情报

AI领航员

搜索

近期热门

七个圈AIGC破圈俱乐部欢迎您！

8.8万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.1万 用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

5.7万 用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.3万 用户在看

大型语言模型

202篇

贡献榜

七个圈

创米

AI情报

AI领航员

8.8万用户在看

7.1万用户在看

5.7万用户在看

5.3万用户在看