全球数字财富领导者
2025-11-08 11:08:02
分享
据月之暗面官网称,Kimi K2 Thinking在评估推理、编码和代理能力的基准测评中创造了新的记录。K2 Thinking在HLE基准评测中取得44.9%的SOTA成绩,在BrowseComp测试中达到60.2%,在SWE-Bench Verified测试中达到71.3%,显示出作为最先进的思考代理模型的强大泛化能力。

24小时热点

暂无内容