就在最近，由耶鲁大学唐相儒、王昱婕，上海交通大学徐望瀚，UCLA万冠呈，牛津大学尹榛菲，Eigen AI金帝、王瀚锐等团队联合开发的Eigen-1多智能体系统实现了历史性突破——在HLE Bio/Chem Gold测试集上，Pass@1准确率达到48.3%，Pass@5准确率更是飙升至61.74%，首次跨越60分大关。这一成绩远超谷歌Gemini 2.5 Pro（26.9%）、OpenAI GPT-5（22.82%）和Grok 4（30.2%）。最令人振奋的是，这一成就并非依赖闭源超大模型，而是完全基于开源的DeepSeek V3.1搭建。（量子位）

就在最近，由耶鲁大学唐相儒、王昱婕，上海交通大学徐望瀚，UCLA万冠呈，牛津大学尹榛菲，Eigen AI金帝、王瀚锐等团队联合开发的Eigen-1多智能体系统实现了历史性突破——在HLE Bio/Chem Gold测试集上，Pass@1准确率达到48.3%，Pass@5准确率更是飙升至61.74%，首次跨越60分大关。这一成绩远超谷歌Gemini 2.5 Pro（26.9%）、OpenAI GPT-5（22.82%）和Grok 4（30.2%）。最令人振奋的是，这一成就并非依赖闭源超大模型，而是完全基于开源的DeepSeek V3.1搭建。（量子位）-火线速递-FX168

24小时热点