Deeply Code - 搜索 News

我让 Claude Code 当裁判，横评 DeepSeek V4 和 GLM-5.1

而整个测试，我全都是让 Claude Code（Opus 4.7）自己完成的：让它自己设计测试方案，自己写 prompt，分别使用 GLM 5.1 和 DeepSeek V4 Pro 跑同样的任务，最后自己评判结果。（我现在很多测试、很多工作都是这么做的……主打一个 0 人工介入。效果好不好另说，但一定得是省事的） ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

我让 Claude Code 当裁判，横评 DeepSeek V4 和 GLM-5.1

今日热点