当地时间周四,Anthropic推出了最新一代混合推理AI模型Claude Opus 4和Claude Sonnet 4,该模型针对编码任务和解决复杂问题进行了优化。
据介绍,这两款模型正在定义人工智能代理的“新标准”,并且“能够分析数千个数据源,执行长时间运行的任务,编写与人类水平相当的内容,并执行复杂的操作”。
Anthropic称,这两个模型都可以搜索网页,代表用户完成任务,并在推理和工具使用之间切换。
一旦获得本地文件的访问权限,他们就可以提取并保存“关键信息,以保持连续性并随着时间的推移构建隐性知识”。
Anthropic还介绍,在客户测试中,Opus 4可以自主运行7个小时,显著拓展了AI代理的可能性。
Anthropic将Claude 4描述为“全球最佳编码模型”,在基准测试中,Opus 4在编码任务和使用网络搜索等“工具”方面的表现优于谷歌的Gemini 2.5 Pro、OpenAI的o3推理和GPT-4.1模型。
定价上,Claude Opus 4和Sonnet 4是混合模型,提供两种模式:近乎即时的响应和用于更深层次推理的扩展思维。
Claude的Pro、Max、Team 和 Enterprise订阅套餐包含这两种模型和扩展思维,Sonnet 4也面向免费用户开放。
这两种模型均可在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。
定价与之前的Opus和Sonnet模型保持一致:Opus 4的每百万个Token输入和输出价格分别为15美元、75 美元,Sonnet 4的每百万个Token输入和输出价格分别为3美元、15 美元。
Anthropic由前OpenAI研究高管创立,于2023年3月推出了其聊天机器人Claude。
自那时起,它就一直参与到初创公司和科技巨头之间日益激烈的人工智能军备竞赛中,预计该市场的收入将在十年内突破1万亿美元。
当下,几乎所有行业的公司都在争相加入人工智能聊天机器人和代理,以免被竞争对手甩在后面。
据Anthropic首席科学官Jared Kaplan称,Anthropic于去年年底停止了对聊天机器人的投资,转而专注于提升 Claude执行复杂任务(例如研究和编码)的能力。
Jared Kaplan承认:“任务越复杂,模型出错的风险就越大……我们非常重视解决这个问题,以便人们能够一次性将大量工作委托给我们的模型。”
Kaplan在一次采访中表示:“我们从去年就开始训练这些模型,并且对它们的表现充满期待。我认为这些模型作为智能体和程序员,其能力要强大得多。这在内部确实很艰难,因为我们用来训练这些模型的一些新基础设施……使得团队在启动和运行所有功能方面非常紧张。”
随着模型的不断迭代,Anthropic的盈利能力也出现快速增长。
上周,Anthropic确认,其第一季度年化营收达到20亿美元,较上一季度的10亿美元增长了一倍多。
该公司营收主管Kate Jensen最近接受采访时表示,Anthropic 年度消费超过10万美元的客户数量同比增长了八倍。