Meta FAIR团队联合UIUC和CMU研究人员提出Self-play SWE-RL系统,让AI通过自我对弈学习编写和修复代码。