将自然语言描述的数学问题转化为形式化语言(Lean 4)仍然是一个重大挑战。不仅要求生成的形式化代码语法上的准确性,还需要对问题语义的深刻理解。以往的研究主要关注于形式化的生成与编译,缺少对评判阶段的关注,即生成的形式化代码是否真正捕捉到 ...