近日,腾讯隆重推出了其全新自研的深度思考模型——混元T1正式版。该模型在大规模强化学习的基础上,针对数学、逻辑推理、科学以及代码等理科领域进行了深度优化,从而显著提升了其推理能力。在各类评估中,混元T1的表现尤为出色。如在MMLU-PRO增强数据集上,其取得了87.2分的高分,在业界顶尖模型o1之后位居前列。同时,在CEval、AIME以及Zebra Logic等公开基准测试中,无论是中英文知识还是竞赛级数学、逻辑推理,混元T1都展现出了领先的性能。

除了基本的推理能力,混元T1正式版还在多项对齐任务、指令跟随任务和工具利用任务中表现出强大的适应性。这得益于其创新架构的沿用,并采用了Hybrid-Mamba-Transformer融合模式。这是工业界首次尝试将混合Mamba架构无损应用于超大型推理模型,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而显著降低了训练和推理的成本。

腾讯最强!混元自研深度思考模型T1 正式发布:吐字快、能秒回

值得一提的是,混元T1拥有卓越的长文捕捉能力,能够有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。混合Mamba架构专门针对长序列处理进行优化,采用高效的计算方式,在保持长文本信息捕捉能力的同时,大幅降低资源消耗。在相近的激活参数量下,混元T1实现了惊人的解码速度提升,达到了两倍。

目前,腾讯混元T1已经向公众开放体验,并上线了API服务。用户只需按照每百万tokens1元的输入价格和每百万tokens4元的输出价格,即可享受这一强大推理模型带来的便捷与高效。同时,用户可以通过这一服务体验腾讯在人工智能领域的前沿技术实力。