-
推理方式更广泛:定理证明可能需要通用和灵活推理,因此定理证明的进步也让推理有了更广泛的发展。
-
搜索: 自动定理证明 系统可以快速检查证明的正确性,因而成为搜索方法应用与发展的生产级环境。
-
自动化数据生成:验证证明的能力使自动生成新问题成为可能,并且这些新问题可以用作训练数据。这就在一定程度上缓解了推理任务中收集高质量数据的难题。
-
该研究验证了生成式预训练能够大幅提升模型性能,基于数学数据(如 arXiv)的预训练性能超过基于网页通用文本的预训练性能;
-
研究发现模型大小与性能存在正相关关系,即使在 Metamath 数据集相对较小的情况下;
-
基于该研究提出的语言模型所生成的命题,迭代式地训练值函数可提升证明器性能,这直接带来了连续自我改进(continuous self improvement)策略:基于证明器生成的证明不断训练;
-
该研究的最优模型在 Metamath 环境中实现了新的 SOTA 结果,在留出测试集中能够证明其中 56.22% 的命题(而目前的 SOTA 方法 MetaGen-IL 只能证明 21.16% 的命题),这表明 Transformer 架构可能适用于形式推理。
参考内容:https://arxiv.org/abs/2009.03393