还有就是:今晚在AGI Bar 知识蒸馏有 GLM 开发者见面会,欢迎大家来玩(见文末) Terminal-Bench 2.1:GLM-5.2 拿 81.0,Opus 4.8 是 85.0,GPT-5.5 是 84.0(5.1 是 63.5) MCP-Atlas:77.0 vs 77.8。SWE-bench Pro:62.1 vs 69.2。NL2Repo:48.9 vs 69.7,这项差距最大 ...
实测一圈下来,结论是——如果你最近要写代码、搭 Agent、做原型,GLM-4.5 可能是 2025 年最值得先上手的国产大模型,没有之一。 这段时间国产 AI 模型非常热闹,各家都瞄着 Coding 和 Agent 场景,开源自己的最新模型。 是个好事,大幅拉近和国际模型的 Coding 差距。
GLM-5.1编程能力实测首次超越Sonnet 4.5 Thinking!国产AI大模型在复杂工程测试中表现强劲,成为首个通过全项目测试的国模,点击了解详细评测。 国产AI大模型迭代速度越来快,智谱前几天发布了GLM-5.1,距离5.0发布也就一个多月时间,而且马上就向GLM Coding Plan全部 ...