腾讯混元:崇拜推出自研深度想考模子混元T1郑再版。在体现推理模子基础智商的常见benchmark上,如大说念话模子评估增强数据集MMLU-PRO中,混元T1获得87.2分亚洲日韩,仅次于o1。在CEval、AIME、Zebra Logic等中英文学问及竞赛级数学、逻辑推理的公开基准测试中,混元T1的得益也达到业界跨越推理模子的水平。