语言模型相关资讯及语言模型相关产品

首页
标签
语言模型
全部文章

语言模型

58篇

内容持续更新中

热门

#StarterPackNoAI

01.AI

1. OCR技术2. PaddleOCR算法模型挑战赛3. 场景文本识别算法SVTRv24. 表格识别算法SLANet-LCNetV2

100万token上下文

11x

1200万美元融资

1688

1950

1X 科技

1型糖尿病专病大模型

20个自由度

2K高清图像

2小时学习模式

2纳米半导体

3000亿参数大模型

新鲜

OpenAI发布GPT-4.1指令提示工程指南

4月15日，OpenAI 发布了针对 GPT-4.1的提示工程指南，为开发者提供了全面的建议和最佳实践，帮助他们更高效地构建和优化 AI 应用。这份指南详细介绍了 GPT-4.1的特性，并提供了从基础…

七个圈

行业资讯

阅读量飙升

电脑游戏《Factorio》成为 AI 能力评估的新工具

《Factorio》是一款复杂的电脑游戏，专注于建造与资源管理，最近成为研究人员评估人工智能能力的新工具。这款游戏能够测试语言模型在规划和构建复杂系统的能力，同时管理多个资源和生产链。为此，研究团队…

七个圈

行业资讯

阅读量飙升

新型语言模型 Huginn：突破推理界限无需语言即可“思考”

近日，来自图宾根埃利斯研究所、马里兰大学和劳伦斯利弗莫尔国家实验室的研究团队，开发出名为 Huginn 的新型语言模型，该模型采用递归架构，显著提升了推理能力。与传统模型不同，Huginn 无需专门的…

七个圈

行业资讯

阅读量飙升

西北工业大学开源语音理解模型OSUM，结合Whisper和Qwen2，支持8种语音理解任务

在人工智能领域，语言模型的快速发展引发了语音理解语言模型（SULMs）的广泛关注。近日，西北工业大学 ASLP 实验室发布了开放语音理解模型 OSUM，旨在探索在学术资源有限的情况下，如何有效训练和利…

七个圈

行业资讯

阅读量飙升

Mistral AI 发布 Saba:专注于中东和东南亚语言的AI模型

Mistral AI 近日推出了名为 Saba 的新型语言模型，该模型专注于提升对中东和东南亚地区语言及文化差异的理解。 Saba 模型拥有240亿参数，虽然规模小于许多竞争对手，但 Mi…

七个圈

行业资讯

阅读量飙升

重磅！斯坦福等高效联手推出AI训练新方法S1，成本暴降性能飙升！

斯坦福大学和华盛顿大学的研究团队近日联合发布了一项突破性的AI训练方法，该方法名为S1，其核心理念在于利用极简的测试时缩放技术来显著提升语言模型的推理能力。与以往依赖庞大算力或复杂算法不同，S1方法巧…

七个圈

行业资讯

阅读量飙升

Sakana AI发布Transformer²:突破语言模型适应性的新技术

日本人工智能公司Sakana AI近日推出了Transformer²，这是一种创新的方法，旨在帮助语言模型更高效地适应多种任务。与现有的人工智能系统不同，Transformer²能够通过两阶段学习过程…

七个圈

精选视频

阅读量飙升

阶跃星辰上线Step-2mini、Step-2文学大师版语言模型

2025年1月20日，上海阶跃星辰智能科技有限公司宣布推出其Step系列语言模型的两款新成员——Step-2mini和Step-2文学大师版。这一举措旨在满足不同创作场景下开发者对语言模型的差异化需求…

七个圈

行业资讯

阅读量飙升

谷歌发布关于生成式 AI智能体的新白皮书，揭示智能助手的未来

谷歌最近发布了一份详细的白皮书，深入探讨了生成式 AI 代理的开发与功能。这份文档阐述了这些智能代理如何利用外部工具，超越传统语言模型的能力，实现更为复杂的任务。在白皮书中，生成式 AI 代理被定义…

七个圈

行业资讯

阅读量飙升

HuggingFace发布全新开源代码库smolagents：支持快速搭建Agent

HuggingFace推出了一款名为 “smolagents” 的全新开源库，该库旨在为语言模型赋予更强的智能代理能力。通过简化的代码结构，smolagents 使得用户能够更容易地构建能够执行各种任…

七个圈

行业资讯

阅读量飙升

阿里推新 AI 基准测试 “PROCESSBENCH”，评估数学推理中的错误识别能力

近日，阿里巴巴 Qwen 团队的研究人员推出了一个名为 “PROCESSBENCH” 的新基准测试，旨在衡量语言模型在数学推理中识别过程错误的能力。随着语言模型在复杂推理任务中取得显著进展，这一领域的…

七个圈

行业资讯

阅读量飙升

还没开口就知道你要干什么？清华、面壁智能联手打造“更懂你”的AI智能体！

近年来，以ChatGPT为代表的大语言模型掀起了 AI 领域的新浪潮。这些强大的语言模型不仅能理解人类指令，还能制定计划、探索环境并利用工具解决复杂任务，展现出在机器人、个人助理和流程自动化等领域的巨…

七个圈

行业资讯

科研狗福音！AI2最新神器OpenScholar来了，科研效率提升10倍！不再熬夜肝文献综述

阅读量飙升

熬夜肝文献综述?抓耳挠腮写论文?别慌!AI2的科研大神们带着他们的最新力作OpenScholar来拯救你了!这款科研效率神器，能让文献综述像逛公园一样轻松愉快! OpenScholar的最大秘密武器，…

七个圈

行业资讯

阅读量飙升

颠覆认知！语言模型训练精度并非越高越好？7-8 位精度才是王道？

在人工智能领域，规模越大似乎就意味着能力越强。为了追求更强大的语言模型，各大科技公司都在疯狂堆叠模型参数和训练数据，结果却发现成本也随之水涨船高。难道就没有一种既经济又高效的方法来训练语言模型吗? 来…

七个圈

行业资讯

阅读量飙升

OpenAI 积极与监管机构洽谈，计划转型为营利公司

据报道，人工智能巨头 OpenAI 正在与加利福尼亚州和特拉华州的监管机构进行初步谈判，计划将公司结构转变为营利性。这家公司以 ChatGPT 闻名，目前的估值达到1570亿美元。根据彭博社的消息，O…

七个圈

行业资讯

阅读量飙升

OpenAI推全新AI基准SimpleQA：测评语言模型的事实准确性

最近，OpenAI 发布了一个名为 SimpleQA 的新基准测试，旨在评估语言模型生成回答的事实准确性。随着大型语言模型的快速发展，确保生成内容的准确性面临着诸多挑战，尤其是那些所谓的 “幻觉” …

七个圈

行业资讯

阅读量飙升

Zamba2-7B：小模型，大能量，引领AI新时代

你是否曾为AI模型庞大的计算资源需求而烦恼？是否希望拥有一个既强大又高效的语言模型来提升工作效率？Zamba2-7B，这款由Zyphra团队开发的7B规模语言模型，或许能为你带来惊喜。你的AI效率困…

七个圈

行业资讯

阅读量飙升

智源推出千万级指令微调数据集Infinity-Instruct

智源研究院推出了一个名为Infinity-Instruct的千万级指令微调数据集，旨在提升语言模型在对话等方面的性能。近日，Infinity Instruct完成了新一轮迭代，包括Infinity-I…

七个圈

行业资讯

阅读量飙升

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

通义千问团队宣布，继Qwen2发布三个月后，Qwen家族的最新成员——Qwen2.5系列语言模型正式开源。这标志着可能是历史上最大规模的开源发布之一，包括了通用语言模型Qwen2.5，以及专门针对编程…

七个圈

行业资讯

阅读量飙升

想做OpenAI替代品！SuperNova：为企业定制、遵循指令的大语言模型

Arcee AI 今天推出了 SuperNova，这是一个为企业提供部署、具有先进指令遵循能力和完全定制选项的700亿参数语言模型。该模型旨在为企业数据隐私、模型稳定性和定制化方面提供强大、可拥有的替…

七个圈

行业资讯

阅读量飙升

不要错过！「Not Diamond」可免费使用 GPT-4o、Claude 3.5 Sonnet 等多种 LLM 大模型

今天要和大家分享的是一个令人兴奋的 AI 平台—— Not Diamond。在这个平台上，你可以免费使用一系列顶尖的大模型，比如 ChatGPT、Claude、Gemini 和 Llama，这些强大的…

在当今这个科技迅猛发展的时代，语言模型已经成为我们生活中不可或缺的工具。从帮助教师制定课程计划，到回答税务法律的问题，再到预测患者出院前的死亡风险，这些模型的应用领域可谓广泛。然而，随着它们在决策中…

七个圈

行业资讯

阅读量飙升

小而美！港大最新推荐系统EasyRec 以文本洞察用户心声

在信息泛滥的时代，推荐系统成为了我们筛选信息的重要助手。但是，你是否曾因为推荐内容不合口味而感到失望?或者在使用新应用时，推荐系统似乎总是无法精准把握你的需求?现在，EasyRec 的出现，或许能够解…

七个圈

行业资讯

阅读量飙升

论文新解！用“画家流水线”揭示Transformer中间层的工作机制

在人工智能的世界里，有一群特殊的"画家"——Transformer模型中的层级结构。它们像一支支神奇的画笔，在语言的画布上描绘出丰富多彩的世界。最近，一篇名为"Trans…

七个圈

行业资讯

阅读量飙升

打开语言模型“黑箱”！Google DeepMind 发布一套可视化工具Gemma Scope

在人工智能的世界里，语言模型如同一个深不可测的黑箱，我们投入文字，它吐出意义。但在这个过程中，究竟发生了什么?Google DeepMind的最新研究——Gemma Scope，为我们揭开了这个黑箱的…

七个圈

行业资讯

阅读量飙升

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%

最近，Zyphra 公司发布了全新的 Zamba2-2.7B 语言模型，这一发布在小型语言模型的发展史上具有重要意义。新模型在性能和效率方面取得了显著提升，它的训练数据集达到了大约3万亿个标记，这使得…

七个圈

行业资讯

阅读量飙升

谷歌发布最强开源语言模型Gemma2 性能超越Llama3

就在不久前的谷歌I/O柏林大会上，谷歌宣布开源其最新语言模型Gemma2，该模型在性能和效率方面取得了重大突破。Gemma2提供9B和27B两种参数规模的版本，其中27B版本的性能已经接近参数量为70…

七个圈

行业资讯

阅读量飙升 32% 组织已部署生成式人工智能

根据站长之家报道，最新调查显示，32% 的组织已在企业应用中部署生成式人工智能。安全问题是最大关注点，而 58% 的组织主要采用 OpenAI 的 GPT-4 语言模型。数据还显示，75% 的组织正在…

新鲜出炉，等待你的评论

暂无评论，快留下你的脚印吧！还可以领现金哦~

七个圈

行业资讯

贡献榜

贡献文章数

七个圈AIGC破圈俱乐部欢迎您！

9.2万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.5万用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

6.1万用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.6万用户在看

语言模型

58篇

阅读量飙升 32% 组织已部署生成式人工智能

贡献榜

七个圈

创米

AI情报

AI领航员

搜索

近期热门

七个圈AIGC破圈俱乐部欢迎您！

9.2万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.5万 用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

6.1万 用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.6万 用户在看

语言模型

58篇

阅读量飙升 32% 组织已部署生成式人工智能

贡献榜

七个圈

创米

AI情报

AI领航员

9.2万用户在看

7.5万用户在看

6.1万用户在看

5.6万用户在看