腾讯全新自研深度思考模型「混元T1」正式发布

近日，腾讯隆重推出了其全新自研的深度思考模型——混元T1正式版。该模型在大规模强化学习的基础上，针对数学、逻辑推理、科学以及代码等理科领域进行了深度优化，从而显著提升了其推理能力。在各类评估中，混元T1的表现尤为出色。如在MMLU-PRO增强数据集上，其取得了87.2分的高分，在业界顶尖模型o1之后位居前列。同时，在CEval、AIME以及Zebra Logic等公开基准测试中，无论是中英文知识还是竞赛级数学、逻辑推理，混元T1都展现出了领先的性能。

除了基本的推理能力，混元T1正式版还在多项对齐任务、指令跟随任务和工具利用任务中表现出强大的适应性。这得益于其创新架构的沿用，并采用了Hybrid-Mamba-Transformer融合模式。这是工业界首次尝试将混合Mamba架构无损应用于超大型推理模型，有效降低了传统Transformer结构的计算复杂度，减少了KV-Cache的内存占用，从而显著降低了训练和推理的成本。

值得一提的是，混元T1拥有卓越的长文捕捉能力，能够有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。混合Mamba架构专门针对长序列处理进行优化，采用高效的计算方式，在保持长文本信息捕捉能力的同时，大幅降低资源消耗。在相近的激活参数量下，混元T1实现了惊人的解码速度提升，达到了两倍。

目前，腾讯混元T1已经向公众开放体验，并上线了API服务。用户只需按照每百万tokens1元的输入价格和每百万tokens4元的输出价格，即可享受这一强大推理模型带来的便捷与高效。同时，用户可以通过这一服务体验腾讯在人工智能领域的前沿技术实力。

七个圈AIGC破圈俱乐部欢迎您！

9.2万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.6万用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

6.2万用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.6万用户在看

腾讯全新自研深度思考模型「混元T1」正式发布

最近更新

文章目录

腾讯全新自研深度思考模型「混元T1」正式发布

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

搜索

近期热门

七个圈AIGC破圈俱乐部欢迎您！

9.2万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

7.6万 用户在看

用AI写出最火的玄幻小说，全过程完整指南！附提示词和思路讲解

6.2万 用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

5.6万 用户在看

腾讯全新自研深度思考模型「混元T1」正式发布

最近更新

文章目录

腾讯全新自研深度思考模型「混元T1」正式发布

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

9.2万用户在看

7.6万用户在看

6.2万用户在看

5.6万用户在看