【导读】Claude又双叒更了!一早,Claude Code上线了「云端自动修复」功能:自主修bug,让PR始终保持绿色。程序员彻底解放双手的这一天终于来了。 这不,今早Claude Code终于上线了「云端自动修复」(auto-fix-in the cloud)的功能。 不论是用网页端,还是手机端,Claude可自动跟进PR。 一旦CI报错,或是有人提出修改意见,它都自主排查问题、写好代码,并推 ...
在 Princeton 发布 SWE-Bench 之后,用真实世界代码仓库+可执行测试评测大模型软件工程能力,几乎已成为学术界与工业界的共识。围绕 SWE issue 的评测范式迅速发展,也催生了一系列 SWE 系列 benchmark,在刻画模型 bug 修复能力方面发挥了重要作用。 但真实的软件工程 ...
3月4日,Claude Code的默认推理从high调成了medium,理由是high模式下延迟太高。但界面上还是显示「high」。用户以为自己在用满血版,实际拿到的是降档货。一个多月后才回滚。
A new report today from code quality testing startup SonarSource SA is warning that while the latest large language models may be getting better at passing coding benchmarks, at the same time they are ...
【导读】Anthropic给Claude Code上了一个新功能,叫agent ...
Google unveiled "Jules" on Wednesday, an artificial intelligence coding assistant that can autonomously fix software bugs and prepare code changes while developers sleep, marking a significant ...
Some software developers are now letting artificial intelligence help write their code. They’re finding that AI is just as flawed as humans. Last June, GitHub, a subsidiary of Microsoft that provides ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果