通过基于梯度的特征归因分析大型语言模型中的思维链提示

Jul, 2023

通过基于梯度的特征归因分析大型语言模型中的思维链提示

Analyzing Chain-of-Thought Prompting in Large Language Models via Gradient-based Feature Attributions

Skyler Wu, Eric Meng Shen, Charumathi Badrinath, Jiaqi Ma, Himabindu Lakkaraju

TL;DR CoT提示法通过梯度特征归因方法揭示其对模型输入的影响，提高了模型对问题扰动和输出变化的鲁棒性。

Abstract

Chain-of-thought (CoT) prompting has been shown to empirically improve the accuracy of large language models (LLMs) on various question answering tasks . While understanding why CoT prompting is effective is cruci

发现论文，激发创造

大型语言模型的提示式编程：超越少样本范式

使用GPT-3模型分析得出少量样例引导更接近于已学习的任务，本文探讨使用自然语言编程来优化引导，提出元引导概念后能够生成更多的任务自然语言引导，展望这些方法如何应用于实践应用。

Feb, 2021

问我任何事：一种激发语言模型的简单策略

使用ASK ME ANYTHING（AMA）方法，通过开发多种不同的有效提示信息并进行权衡，采用弱监督程序结合这些提示信息来创造性地提高了大型语言模型的性能。该方法可以使开源GPT-J-6B模型在15个流行基准测试中优于few-shot GPT3-175B模型。

Oct, 2022

自动发现的链式思维提示适用于新模型和数据集

通过使用自动探索的 CoT prompt 对多个 LLMs 进行无监督语言生成，我们发现将该 prompt 应用于最新的 GPT-4 模型是最优的。

May, 2023

迈向更好的思路链引导策略：调研

我们对Chain-of-Thought (CoT)的关键因素进行了系统和全面的分析，介绍了如何在不同应用中更好地应用CoT提示，并提出了一些建议和未来的研究方向。

Oct, 2023

大型语言模型中关于提示工程的系统调查：技术与应用

本综述论文通过提供近期进展的结构化概述，对提示工程的不同方法和技术进行分类，详细介绍了提示方法学、应用领域、所使用的模型和数据集，并探讨了每种方法的优点、局限性以及通过分类图和表格总结了数据集、模型和关键点，从而更好地理解这一快速发展领域并为提示工程的未来研究提供洞察、揭示了开放性挑战和机遇。

Feb, 2024

低资源环境下的预训练语言模型解释与归因分析

通过分析从基于提示的模型中提取的归因得分的合理性和忠实性，并将其与从微调模型和大型语言模型中提取的归因得分进行比较，我们发现使用基于提示的范例（无论是基于编码器的模型还是解码器的模型）比在低资源环境下微调模型产生更合理的解释，并且Shapley Value Sampling在产生更合理和忠实的解释方面始终优于注意力和积分梯度。

Mar, 2024

大型语言模型的高效提示方法综述

在这篇论文中，我们对高效提示的各种方法进行了全面的概述，包括使用高效计算和高效设计进行提示的方法，重点关注未来的研究方向。

Apr, 2024

揭示和操控大型语言模型中的提示影响

通过使用Token Distribution Dynamics方法，我们揭示了Prompt输入对于生成大型语言模型(如GPT)输出的重要作用，该方法显著优于现有的基线方法，并且在控制文本生成方面具有潜力应用于抑制有害语言和调节情感。

May, 2024

揭示链式思维提示方法的统计基础

本文从统计估计的角度分析链式思维（CoT）提示及其变体，针对其样本复杂性进行了全面描述。研究表明，在大规模预训练数据集的情况下，CoT 提示形成的估计量等同于贝叶斯估计量，有效解决多步推理问题，并通过实验验证了理论结果。

Aug, 2024

揭示链式思维提示方法的统计基础

本研究聚焦于链式思维提示（CoT）在多步推理问题中的有效性，填补了对其样本复杂度的统计分析这一空白。研究引入了一种多步潜在变量模型，表明当预训练数据集足够大时，CoT提示形成的估计器等同于贝叶斯估计器，其统计错误可以分解为提示误差和预训练模型的统计误差。关键发现是，提示误差随着演示样本数量的增加呈指数衰减，展示了这种方法在多步推理中的有效性和潜在影响。

Aug, 2024