全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
FX168财经网
>
速递
>
正文
>
2025-11-08 11:40:04
分享
GPT-5和Claude Sonnet 4.5 Thinking仍然是领先的思考模型。然而,在相同的基准测试中,Kimi K2 Thinking的代理推理得分超过了两者:例如,在BrowseComp测试中,K2 Thinking以60.2%的分数绝对领先GPT-5的54.9%和Claude的24.1%。K2 Thinking在GPQA Diamond测试中也以85.7%的分数超过了GPT-5的84.5%,在AIME 2025和HMMT 2025等数学推理任务上也与GPT-5不相上下。
24小时热点
暂无内容