腾讯混元自研深度思考模型「T1」正式发布

客服

2025-3-21 23:13

腾讯混元3月21日周五宣布，正式推出自研深度思考模型混元T1正式版。

腾讯混元称，混元T1正式版沿用了混元Turbo S的创新架构，采用Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。

腾讯混元概括，混元T1正式版的特点为“吐字快、能秒回”、“擅长超长文处理”，称它是腾讯自研的强推理模型。

速度方面，混元T1正式版在可比参数量下的解码性能高于行业2倍，首字秒出，吐字速度每秒60至80token，具备优秀的长文处理能力。多项指标达到业界领先推理模型的水平，效果方面，混元T1正式版逻辑强、文风简洁、复杂指令跟随准确，摘要幻觉低。

通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元T1正式版进一步提升了推理能力。

在体现推理模型基础能力的常见评估指标中，如大语言模型（LLM）评估增强数据集MMLU-PRO中，混元T1取得87.2分，仅次于得分89.3的OpenAI o1，高于得分86.1的OpenAI GPT 4.5和得分84的DeepSeek R1和。

在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中，混元T1的成绩也达到业界领先推理模型的水平，其中，逻辑推理得分93.1，高于前述三个模型o1、GPT 4.5和R1。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

上一篇：美联储理事沃勒解释3月会议投唯一反对票：美国的银行准备金高于充裕水平

下一篇：美元与美股同跌这么久，这很不寻常！

		自动登录	找回密码
密码			立即注册