这几天,Anthropic 的最新模型 Claude Fable 5 发布之后,在 AI 圈激起了不小的震动。 今天一早,大模型评测平台 Arena 放出了智能体基准测试(Agent Arena)的成绩:Fable 5(High)排名第一,OpenAI 的 GPT-5.5(xHigh)屈居第二。另外,在「确认成功率」和「可引导性」等两项指标上,Fable 5(High)也稳压 GPT-5.5(xH ...
根据最新 Design Arena 榜单,GLM 5.2 超越 Claude Fable 5、Opus 4.6 和 Opus 4.7 登顶但,比其前代 GLM 5.1 提升 5 个名次。GLM 5.2 每百万 tokens 的推理价格为 1.40/4.40 美元,远低于 Fable 5 的 10/50 美元,在性价比上占据绝对优势。
【本文由小黑盒作者@飞碟AI于06月22日发布,转载请标明出处!】 前天放假在家,闲来无事刷推,然后看到关注的@Designarena发了条文章: 他们刚放出了最新一版的单轮 Web Design 榜单,第一名居然是—— GLM-5.2。
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 在 Coding 这件事上,国产AI又famous了一下。 因为刚刚,在Claude Fable 5之下,开源界里拿下了 AI编程第一 (全球第二): 不仅Arena官方用 “令人难以置信的里程碑 ...
6 月 17 日,智谱 AI 正式上线并开源了新一代旗舰大模型GLM-5.2。在全球百万用户参与盲测的前端开发评估系统 Code Arena 上,它一举拿下全球可用模型第一的成绩。在 Arena WebDev 榜单中,GLM-5.2 也仅次于 ...
最近,Anthropic推出了其最新的人工智能模型Claude Fable 5,这一发布在AI界引起了广泛关注。特别是在AI评测平台Arena的最新成绩中,Fable 5(High)以优异的表现排名第一,超越了OpenAI的GPT-5.5(xHigh)。在「确认成功率」和「可引导性」等多个指标上,Fable 5的表现也稳居领先,显示出其强大的能力。 然而,在另一项智能体基准测试——由加州大学伯克利 ...
72小时后,美国商务部下发强制通知,要求Anthropic切断所有非美国公民对Fable 5的访问。只给了90分钟执行。因为系统无法区分用户国籍,Anthropic干脆全球禁用了这款模型。连原本定好的Fable 5开发者大会,主角都被临时换成了Opus 4.8。 6月9日,Anthropic发布Claude Fable 5和Mythos ...