2025年10月,Meta等机构发表的论文《Agent Learning via Early Experience》提出了第三条路——“中训练”范式,试图用一种廉价而有效的反馈形式,为Agent训练搭建关键桥梁。