跳到主要内容

(一)什么是提示词工程

阅读前了解

在了解提示词之前,我们首先来了解下什么是大语言模型?

大语言模型大家可以理解为一种采用人工智能算法构造的一个程序系统,它能够理解和生成人类语言。这些模型通过分析大量的文本数据学习语言的模式和结构,从而可以用来执行各种自然语言处理任务,比如语言翻译、文本摘要、情感分析、问答系统等。

我们可以把大语言模型想象成一个非常聪明的“语言学生”,它通过阅读大量的书籍、文章、网页等文本资料来学习语言。学得越多,它就越能理解复杂的语言结构和含义,也能更准确地生成自然流畅的语言表达。

这些模型的“大”主要体现在它们的参数量上,即模型内部用于捕捉语言特征的变量的数量。大的模型通常有数十亿甚至千亿级别的参数,这使得它们能够存储和处理更多的语言信息,从而在理解和生成语言方面表现得更加出色。由于这个参数主要是用于大模型的算法执行上使用,因此,这里大家只需要简单的知道,“参数”量越大,所需要的计算量也会越大,需要的资源也越多,相对这个模型“懂得”也越多,也越“聪明”​。

举个例子,如果你给一个大语言模型一个关于某个主题的问题,它能够理解这个问题,然后在它学到的海量信息中找到相关的答案,并以自然的方式回答你。同样,如果你让它写一篇关于某个话题的文章,它也能够根据它对语言的掌握生成一篇内容丰富、表达流畅的文章。

我们开始

提示词,英文中称为 Prompt,是一个在与大语言模型(如ChatGPT、文心一言,智谱清言,通义千问等)交互时使用的引导性描述或输入。也许有很多的同学还不清楚“大语言模型”是什么?为了便于大家理解,我们可以将大语言模型看作一个智能机器人助手。当我们向智能机器人提出问题或者请求时,所使用的那些特定的词语、短语或者整个句子,就是所谓的“提示词”。

举个例子,如果你想要大语言模型写一首诗,那么你的提示词可能是:“请你创作一首关于秋天的五言绝句。”在这个场景中,“请创作一首关于秋天的五言绝句”就是那个关键的提示词,通过这个大语言模型,大语言模型能够明白你需要什么类型的文本内容。

简单来说,提示词是我们在与大语言模型交流时用来启动对话、设定任务或引导生成特定内容的核心输入内容,恰当而富有创意的提示词运用可以显著提升沟通效率和结果质量。通过巧妙地运用提示词工程的方法论,即使是非专业人员也能更好地驾驭像大语言模型这样的大语言模型,实现更丰富多样的应用场景。

一句话介绍提示词

提示词就是:是我们与大语言模型进行交互时所提出的问题或指令,它不仅包含我们想要获取的信息内容,还体现了对模型回复预期格式和详细程度的要求。

比如,我们向大语言模型提问:

 地球的赤道周长是多少,以千米计量?

这个提出问题就叫做提示词,这个问题也就是向大语言模型输入的内容。

大语言模型的回复是:

地球的赤道周长大约是40,075千米。

这个回复就是大语言模型对提示词的回复,也就是这个问题回答。

为什么要有提示词工程

提示词工程(Prompt Engineering),这一术语代表了一门专注于如何有效设计和优化提示词以激发大语言模型产生更准确、更具针对性响应的学科领域。在日常应用中,提示词就如同我们对大语言模型发出的清晰指令,帮助它理解我们的意图,并输出高质量的信息。

大家可能会问,不就是向机器人提问题,提要求吗,这有什么难的。至于衍生出来一门学科?其实问问题还真是一门学问,就像我们在日常生活中,针对一个问题有些人几句话就能描述明白他的诉求,而有些人说了很多,结果大家仍然不明白他要表达什么。所以我们也可以把提示词工程理解为“说话和表达的学问”。

提示词工程的重要性在于其背后的复杂性和灵活性。看似简单的提问实则蕴含了如何有效引导和约束模型输出的关键。即便针对同一问题——地球赤道周长,如果我们变换提问方式为“地球赤道的周长是多少?”,大语言模型会基于默认的理解给出更为丰富的回答,包括周长数值、计量单位转换以及相关地理知识的补充说明。因为我们表达提出的问题是大语言模型大语言模型能够理解的描述,并且按照我们希望的结果返回输出回复。但不同的提问描述(输入的提示词),大语言模型给出的回答将有所不同。

还是拿以上问题提问,换一个描述方式:

地球赤道的周长是多少?

此时我们没有要求大语言模型按要求的计量单位回复,得到的结果是:

地球的赤道周长大约是40,075公里(24,901英里)。
这个长度是基于地球的平均半径,大约是6,371公里(3,959英里)。
赤道是地球上纬度为0度的想象线,它将地球分为北半球和南半球。

返回的回答描述,更详细更多了一些。我们再换一个问法:

地球赤道的周长是多少?简要回答。

回复结果是:

地球赤道的周长大约是40,075公里。

回复简单了很多。提示词的意图描述的准确性,要求的表达方式都将影响到大语言模型的回复结果。

我们在用返回的图片结果对比下相似的提示词描述对返回结果的差异性对比。

下面我们使用提示词来描述一张图片:

给我一张风景优美图片,包含天空的极光,美丽的大森林,明亮的湖泊,
湖泊上有一艘邮轮,岸边有一群动物在休息。

大语言模型的回复的图片如下:

在变更下提示词的描述:

给我一张风景优美图片,包含天空的极光,美丽的大森林,明亮的湖泊,
湖泊上有一艘邮轮,宽阔的高速公路在岸边

大语言模型的回复的图片如下:

从两次的提示词描述和大语言模型的回复结果可以看到,输入提示词的描述稍有不同,返回结果的图片展示的元素和风格都有明显的差异。

总结

提示词,从本质上而言,是一种探究问题核心的学问,其目标在于引导沟通者清晰、准确地表述自己的疑惑或需求。在与“大语言模型”互动的过程中,提出高质量的问题至关重要,因为提问越明确、精细,就越能得到精准且有针对性的回答结果。提示词工程的核心价值在于教导大家如何高效大语言模型“大语言模型”提问,掌握何种表达方式能够充分揭示问题的本质,以及运用何种格式来构建条理分明、意图清晰的问题框架。

接下来,我们将深入探讨如何精心组织和构建提示词的描述,以期帮助大家提升问题表述的精准度。我们将详尽介绍如何更准确地界定问题边界,如何细腻地描绘问题情境,以及如何更明确地传达期望得到的回复内容,从而确保“大语言模型”能为用户提供最贴切、最有价值的信息反馈。