腾讯混元3月21日周五宣布,正式推出自研深度思考模型混元T1正式版。

腾讯混元称,混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。

腾讯混元概括,混元T1正式版的特点为“吐字快、能秒回”、“擅长超长文处理”,称它是腾讯自研的强推理模型。

速度方面,混元T1正式版在可比参数量下的解码性能高于行业2倍,首字秒出,吐字速度每秒60至80token,具备优秀的长文处理能力。多项指标达到业界领先推理模型的水平,效果方面,混元T1正式版逻辑强、文风简洁、复杂指令跟随准确,摘要幻觉低。

通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步提升了推理能力。

在体现推理模型基础能力的常见评估指标中,如大语言模型(LLM)评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于得分89.3的OpenAI o1,高于得分86.1的OpenAI GPT 4.5和得分84的DeepSeek R1和。

在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平,其中,逻辑推理得分93.1,高于前述三个模型o1、GPT 4.5和R1。


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

返回顶部
返回顶部