一个阳光明媚的早晨,住在旧金山的软件工程师 Anna 像往常一样,坐在电脑前,打开 ChatGPT,输入 " 帮我规划我的一天 "。
ChatGPT 回答 " 当然可以!",随机给出从早上到晚上的日程计划,并提示 " 你可以根据自己的情况进行调整。"
Anna 想了想,在对话框里补充," 我晚上 9 点要哄娃睡觉,重新帮我规划。"
这一次,ChatGPT 的帮她在晚上的日程里添加了 " 帮助孩子准备第二天上学准备物品 " 和 " 帮助孩子洗漱并睡觉 " 等事项。
随着 ChatGPT 等 AI 工具的风靡,Anna 身边越来越多的人开始将其作为日常生活和工作的助手。事实上,Anna 不仅会向 ChatGPT 咨询生活安排,也会让它处理一些简单的工作,比如给一段代码添加一个功能等。
不过,当涉及到比较复杂的任务时,即便知道 ChatGPT 很强大,Anna 也觉得有点力不从心," 说了一堆要求,但是它给出的代码经常不是我想要的。"
Anna 的这句话道出了目前困扰不少科技公司的一个问题:在强大的工具面前,如何更好的与它对话,来完成专业任务?
对此,一个新兴职业——提示工程师(Prompt Engineer)应运而生。不少公司对这一职位求贤若渴,开出的薪资甚至高达 33.5 万美元一年。
提示工程师的主要职责是帮助训练大型语言模型 ( LLM ) ,让 AI 能更好的理解需求,完成专业任务。简而言之,他们的任务就是将一个复杂的任务拆分,提炼成长度有限的自然语言,来一步步查询 AI 工具,从而获得更准确的回答。
用自然语言对话,这听起来是一件再日常不过的事情,可它为什么一下子成为了香饽饽?
重启对话:逻辑让 AI 更懂需求
在旧金山,AI 研究公司 Anthropic 为提示工程师开出的薪水高达 33.5 万美元。在职位描述中,该公司提到," 这是编程、指导和教学的结合 ",主要职责是帮助公司构建提示库,让 LLM 完成不同的任务。
那么,到底什么是提示?提示工程又是什么?
按照学者们的定义,提示是一组输入文本或指令,用于指导 ChatGPT 等 AI 模型生成所需的输出。换句话说,提示是一种特定文本,它的目标是让 AI 模型产出符合特定标准或参数的结果。
提示工程则是是创建和完善这些提示,以生成所需结果的过程。提示工程的目标是创建准确有效的提示。提示工程师使用自然语言,并将纯文本命令发送到 AI 模型,让其执行实际工作。相比之下,传统程序员则使用编程语言,通常需要更多的代码编写和技术知识,以执行相同的任务。
而提示工程师的薪资如此之高,很大程度上是因为语言模型的成功取决于编写清晰的提示。这需要工程师们开发复杂的策略,将简单的输入转化为高质量的结果,避免出现离题或者不一致的输出。
目前最出名的提示工程师可能是名为 Riley Goodside 的程序员,就是他发现,只要提示 ChatGPT" 忽略之前的指示 ",ChatGPT 就会说出自己从 OpenAI 那里获取的 " 出厂设置 " 信息。
图源:Twitter
不仅如此,他还凭借出色的提示技术,把 ChatGPT 玩出了不少花样,并在 Twitter 上一炮而红。随后,他高薪加入了创业公司 Scale AI,成为了 " 世界上第一个被招聘的提示工程师 "。
在 Scale AI 看来,AI 大模型可以被视为一种新型计算机,而 " 提示工程师 " 则相当于其编程人员。通过提示工程找到最合适的提示词,可以激发 AI 大模型的最大潜力。所以,Riley Goodside 完全配得上这份薪水。
不止 Riley Goodside,还有越来越多的人正在加入这个行业。
29 岁的 Albert Phelps 是 AI 金融咨询公司 Mudano 的一位提示工程师。他和同事们的日常就是为 OpenAI 等工具编写提示。这些提示可以作为预设,保存在 OpenAI 的 Playground 中,供其客户使用。Phelps 介绍,他们每天需要编写 5 个不同的提示,与 ChatGPT 进行大约 50 次交互。
和大多数程序员不一样的是,Phelps 并没有计算机相关背景,而是毕业于历史系。事实上,对于提示工程师而言,最重要的是逻辑。虽然编程知识和机器学习的背景对工作很有帮助,但却并不是必要条件。
Anthropic 的技术人员 Matt Bell 就曾提到," 我们最好的提示工程师是一位哲学家。好的提示包括写出极其清晰的解释,并找出造成误解的原因以及如何避免误解。"
也就是说,当 AI 模型的使用者像软件工程师 Anna 一样,一次性 " 说了一堆要求 " 时,可能会因为提示不清晰,而导致 AI 误解,给出离题的答案。
对此,阿德莱德大学澳大利亚机器学习研究所 ( AIML ) 的高级讲师 Lingqiao Liu 指出,好的提示工程的关键是将一项复杂的任务分解成一组简单的任务。
他介绍,如果你问这些模型一个简单的问题(称为 " 零样本提示 "),它通常会以缺乏细节或结构的 " 普通 " 答案作为回应。为了让 AI 模型给出更加符合标准的结果,用户可以采取以下几种方式:
第一种方法是一次性提示,即用户给出一对问答示例,让 AI 了解需求,并按照该模版处理后续请求。比如,在咨询关于某一种动物的信息时,让模型根据特点、居住区域、饮食习惯等来给出信息。
第二种是角色提示,例如告诉模型 " 我是一个妈妈,想要知道每天行程规划 ",从而让模型根据 " 妈妈 " 的角色来给出具体安排。
第三种方法是引入关键代理。例如,你可以让 ChatGPT 写一个关于机器人的故事,然后让它根据自己的建议进行批评和改写。
最后一种方法是思维链,即先让 AI 对回答某个问题给出具体步骤,然后在鼓励它依照自己给出的步骤,来推理更复杂的问题。
如果一位艺术家想要使用 ChatGPT 和 Midjourney 来进行创作,或许可以尝试一下这一条来自 PromptHero 的高赞提示:
[ 我想让你充当 Midjourney 人工智能程序的提示生成器。你的工作是提供详细的、有创意的描述,以激发 AI 独特而有趣的图像。请记住,AI 能够理解多种语言并能解释抽象概念,因此请尽可能发挥想象力和描述性。例如,您可以描述未来城市的场景,或者充满奇怪生物的超现实景观。您的描述越详细、越富有想象力,生成的图像就会越有趣。这是你的第一个提示:" 一望无际的野花田,每一个都有不同的颜色和形状。在远处,一棵巨大的树耸立在风景之上,它的树枝像触手一样伸向天空 " ]
总之,对于生成文本的 AI 模型而言,如何编写出逻辑清晰的提示至关重要。不过,在其他领域,好的提示可能需要更多元素。
构建图像:关键词拓展想象力
随着提示工程的价值被挖掘,这股新鲜血液开始涌向更多场景。图像则是其中最受关注的领域之一。
就图像生成而言,创造者们认为提示的好坏与否取决于关键词。
七个月前,Jason Allen 凭借着下面这张在 Midjourney 上创作的一幅作品《太空歌剧院》赢得科罗拉多州的一场艺术比赛。
Jason Allen 获奖作品 《太空歌剧院》
为了这幅作品,他耗时约 80 小时,在 Midjourney 中测试不同的美学元素,给出不同的主题提示,才呈现出自己想要的图像。
" 我想创造一个电影场景,就像你在电影中看到的那样," 他说," 所以我上网查找了所有与电影摄影相关的关键词。基本上就是是在学习成为一名电影摄影师。"
通常,AI 模型会从互联网上抓取大量图像及其相关文本进行训练。例如,它可能会对一幅婚纱照打上 " 新娘 "、" 婚纱 "、" 捧花 "、" 微笑 " 等不同标签,并标记上不同的权重。每个标签会给 AI 模型相应提示,产生可预测的美感。
"AI 艺术的关键在于知道正确的词。就像工程师将设计转化为数学图形一样,它将图像的离散美学元素,比如光线追踪、边缘照明等,转化为模型的特殊语言 ",和 Jason 一样通过 AI 来进行创作的另一位艺术家 JHawkk 提到。
JHawkk 制作的图像
JHawkk 在 Stable Diffusion 中制作了上面这张图,其提示包括 " 模拟风格 "、" 佳能 EF 50mm f/1.8 STM 镜头 " 等 15 个短语,以及 " 恶心 " 等他不希望出现在图像中的 31 个负面词汇。
" 有时你看到一幅图像,可以将他分解成更小的短语,本质上,这是你描述图像的方式,并且是实际模型本身可以理解的方式。" 他说。
JHawkk 居住在美国中西部,他平时喜欢在 PromptHero 上分享自己的作品和相应的提示。
PromptHero 是去年 9 月成立的在线社区,目前拥有 15 万名用户,其中 活跃用户就超过 1 万名。在这里,用户可以找到直接在 ChatGPT、Midjourney 等 AI 模型和平台中使用的提示。
" 我发现了这个问题,当你第一次用它完成某件事时,你的第一次尝试是非常糟糕的,"PromptHero 联合创始人 Javier Ramirez 说," 你需要以正确的方式提示以获得高质量的输出。"
无论是文本还是图像,如何给出正确提示是一个需要反复试验的过程,正因如此,在过去半年,才会有大量类似 PromptHero 和 PromptBase 等提示交流和买卖平台涌现——他们将验证过的提示直接摆在用户面前。
想做一张可爱考拉的图片?下面这则提示或许可以直接拿走。
觉得英语不过关?下面这则提示或许能让 ChatGPT 成为你最好的英语老师。
热闹背后的担忧
不管是科技公司开出的高薪,还是提示交流平台的流行,它们无一不在揭示提示工程是一个被多么看好的领域。
不过,这样的热度也引起了不少争议。
首先,AI 通过提示创作的作品,版权归谁?
目前,通过提示工程生成的作品与大多数版权法的解释相冲突。在美国,当 Jason Allen 对获奖作品《太空歌剧院》申请版权时,版权局拒绝了他的申请,称 " 它不包含任何人类作者身份 "。
其次,提示工程师的高薪值得吗?
" 这可能是泡沫的迹象," 为亚马逊 Alexa 开发语音控制功能的对话设计工作室 labworks.io 的创始人 Tom Hewitson 说, " 最适合做这件事的人是熟悉 AI 的产品设计师或业务分析师,他们的年收入往往在 10 万到 15 万英镑之间。"
最后,提示工程师的职位会存在多久?
不少人认为,提示工程只会成为一种技能,并不需要一个专门的职位。随着 AI 工具在理解人类查询方面变得越来越好,这个职位会变得越来越过时。
沃顿商学院教授 Ethan Mollick 在 2 月份发推文说:" 我强烈怀疑‘提示工程’从长远来看不会有什么大不了的,提示工程师也不是未来会存在的工作。"
剑桥大学机器学习研究主任 Adrian Weller 认为,虽然能够通过提示与 AI 交互 " 具有很高的价值 ",但 " 我不确定它是否会继续下去很长一段时间。不要过多关注提示工程的当前。它会很快发展的。"
尽管提示工程师的职业当前备受瞩目,但它到底能够走多远,恐怕只有时间才能解答了。
一个阳光明媚的早晨,住在旧金山的软件工程师 Anna 像往常一样,坐在电脑前,打开 ChatGPT,输入 " 帮我规划我的一天 "。
ChatGPT 回答 " 当然可以!",随机给出从早上到晚上的日程计划,并提示 " 你可以根据自己的情况进行调整。"
Anna 想了想,在对话框里补充," 我晚上 9 点要哄娃睡觉,重新帮我规划。"
这一次,ChatGPT 的帮她在晚上的日程里添加了 " 帮助孩子准备第二天上学准备物品 " 和 " 帮助孩子洗漱并睡觉 " 等事项。
随着 ChatGPT 等 AI 工具的风靡,Anna 身边越来越多的人开始将其作为日常生活和工作的助手。事实上,Anna 不仅会向 ChatGPT 咨询生活安排,也会让它处理一些简单的工作,比如给一段代码添加一个功能等。
不过,当涉及到比较复杂的任务时,即便知道 ChatGPT 很强大,Anna 也觉得有点力不从心," 说了一堆要求,但是它给出的代码经常不是我想要的。"
Anna 的这句话道出了目前困扰不少科技公司的一个问题:在强大的工具面前,如何更好的与它对话,来完成专业任务?
对此,一个新兴职业——提示工程师(Prompt Engineer)应运而生。不少公司对这一职位求贤若渴,开出的薪资甚至高达 33.5 万美元一年。
提示工程师的主要职责是帮助训练大型语言模型 ( LLM ) ,让 AI 能更好的理解需求,完成专业任务。简而言之,他们的任务就是将一个复杂的任务拆分,提炼成长度有限的自然语言,来一步步查询 AI 工具,从而获得更准确的回答。
用自然语言对话,这听起来是一件再日常不过的事情,可它为什么一下子成为了香饽饽?
重启对话:逻辑让 AI 更懂需求
在旧金山,AI 研究公司 Anthropic 为提示工程师开出的薪水高达 33.5 万美元。在职位描述中,该公司提到," 这是编程、指导和教学的结合 ",主要职责是帮助公司构建提示库,让 LLM 完成不同的任务。
那么,到底什么是提示?提示工程又是什么?
按照学者们的定义,提示是一组输入文本或指令,用于指导 ChatGPT 等 AI 模型生成所需的输出。换句话说,提示是一种特定文本,它的目标是让 AI 模型产出符合特定标准或参数的结果。
提示工程则是是创建和完善这些提示,以生成所需结果的过程。提示工程的目标是创建准确有效的提示。提示工程师使用自然语言,并将纯文本命令发送到 AI 模型,让其执行实际工作。相比之下,传统程序员则使用编程语言,通常需要更多的代码编写和技术知识,以执行相同的任务。
而提示工程师的薪资如此之高,很大程度上是因为语言模型的成功取决于编写清晰的提示。这需要工程师们开发复杂的策略,将简单的输入转化为高质量的结果,避免出现离题或者不一致的输出。
目前最出名的提示工程师可能是名为 Riley Goodside 的程序员,就是他发现,只要提示 ChatGPT" 忽略之前的指示 ",ChatGPT 就会说出自己从 OpenAI 那里获取的 " 出厂设置 " 信息。
图源:Twitter
不仅如此,他还凭借出色的提示技术,把 ChatGPT 玩出了不少花样,并在 Twitter 上一炮而红。随后,他高薪加入了创业公司 Scale AI,成为了 " 世界上第一个被招聘的提示工程师 "。
在 Scale AI 看来,AI 大模型可以被视为一种新型计算机,而 " 提示工程师 " 则相当于其编程人员。通过提示工程找到最合适的提示词,可以激发 AI 大模型的最大潜力。所以,Riley Goodside 完全配得上这份薪水。
不止 Riley Goodside,还有越来越多的人正在加入这个行业。
29 岁的 Albert Phelps 是 AI 金融咨询公司 Mudano 的一位提示工程师。他和同事们的日常就是为 OpenAI 等工具编写提示。这些提示可以作为预设,保存在 OpenAI 的 Playground 中,供其客户使用。Phelps 介绍,他们每天需要编写 5 个不同的提示,与 ChatGPT 进行大约 50 次交互。
和大多数程序员不一样的是,Phelps 并没有计算机相关背景,而是毕业于历史系。事实上,对于提示工程师而言,最重要的是逻辑。虽然编程知识和机器学习的背景对工作很有帮助,但却并不是必要条件。
Anthropic 的技术人员 Matt Bell 就曾提到," 我们最好的提示工程师是一位哲学家。好的提示包括写出极其清晰的解释,并找出造成误解的原因以及如何避免误解。"
也就是说,当 AI 模型的使用者像软件工程师 Anna 一样,一次性 " 说了一堆要求 " 时,可能会因为提示不清晰,而导致 AI 误解,给出离题的答案。
对此,阿德莱德大学澳大利亚机器学习研究所 ( AIML ) 的高级讲师 Lingqiao Liu 指出,好的提示工程的关键是将一项复杂的任务分解成一组简单的任务。
他介绍,如果你问这些模型一个简单的问题(称为 " 零样本提示 "),它通常会以缺乏细节或结构的 " 普通 " 答案作为回应。为了让 AI 模型给出更加符合标准的结果,用户可以采取以下几种方式:
第一种方法是一次性提示,即用户给出一对问答示例,让 AI 了解需求,并按照该模版处理后续请求。比如,在咨询关于某一种动物的信息时,让模型根据特点、居住区域、饮食习惯等来给出信息。
第二种是角色提示,例如告诉模型 " 我是一个妈妈,想要知道每天行程规划 ",从而让模型根据 " 妈妈 " 的角色来给出具体安排。
第三种方法是引入关键代理。例如,你可以让 ChatGPT 写一个关于机器人的故事,然后让它根据自己的建议进行批评和改写。
最后一种方法是思维链,即先让 AI 对回答某个问题给出具体步骤,然后在鼓励它依照自己给出的步骤,来推理更复杂的问题。
如果一位艺术家想要使用 ChatGPT 和 Midjourney 来进行创作,或许可以尝试一下这一条来自 PromptHero 的高赞提示:
[ 我想让你充当 Midjourney 人工智能程序的提示生成器。你的工作是提供详细的、有创意的描述,以激发 AI 独特而有趣的图像。请记住,AI 能够理解多种语言并能解释抽象概念,因此请尽可能发挥想象力和描述性。例如,您可以描述未来城市的场景,或者充满奇怪生物的超现实景观。您的描述越详细、越富有想象力,生成的图像就会越有趣。这是你的第一个提示:" 一望无际的野花田,每一个都有不同的颜色和形状。在远处,一棵巨大的树耸立在风景之上,它的树枝像触手一样伸向天空 " ]
总之,对于生成文本的 AI 模型而言,如何编写出逻辑清晰的提示至关重要。不过,在其他领域,好的提示可能需要更多元素。
构建图像:关键词拓展想象力
随着提示工程的价值被挖掘,这股新鲜血液开始涌向更多场景。图像则是其中最受关注的领域之一。
就图像生成而言,创造者们认为提示的好坏与否取决于关键词。
七个月前,Jason Allen 凭借着下面这张在 Midjourney 上创作的一幅作品《太空歌剧院》赢得科罗拉多州的一场艺术比赛。
Jason Allen 获奖作品 《太空歌剧院》
为了这幅作品,他耗时约 80 小时,在 Midjourney 中测试不同的美学元素,给出不同的主题提示,才呈现出自己想要的图像。
" 我想创造一个电影场景,就像你在电影中看到的那样," 他说," 所以我上网查找了所有与电影摄影相关的关键词。基本上就是是在学习成为一名电影摄影师。"
通常,AI 模型会从互联网上抓取大量图像及其相关文本进行训练。例如,它可能会对一幅婚纱照打上 " 新娘 "、" 婚纱 "、" 捧花 "、" 微笑 " 等不同标签,并标记上不同的权重。每个标签会给 AI 模型相应提示,产生可预测的美感。
"AI 艺术的关键在于知道正确的词。就像工程师将设计转化为数学图形一样,它将图像的离散美学元素,比如光线追踪、边缘照明等,转化为模型的特殊语言 ",和 Jason 一样通过 AI 来进行创作的另一位艺术家 JHawkk 提到。
JHawkk 制作的图像
JHawkk 在 Stable Diffusion 中制作了上面这张图,其提示包括 " 模拟风格 "、" 佳能 EF 50mm f/1.8 STM 镜头 " 等 15 个短语,以及 " 恶心 " 等他不希望出现在图像中的 31 个负面词汇。
" 有时你看到一幅图像,可以将他分解成更小的短语,本质上,这是你描述图像的方式,并且是实际模型本身可以理解的方式。" 他说。
JHawkk 居住在美国中西部,他平时喜欢在 PromptHero 上分享自己的作品和相应的提示。
PromptHero 是去年 9 月成立的在线社区,目前拥有 15 万名用户,其中 活跃用户就超过 1 万名。在这里,用户可以找到直接在 ChatGPT、Midjourney 等 AI 模型和平台中使用的提示。
" 我发现了这个问题,当你第一次用它完成某件事时,你的第一次尝试是非常糟糕的,"PromptHero 联合创始人 Javier Ramirez 说," 你需要以正确的方式提示以获得高质量的输出。"
无论是文本还是图像,如何给出正确提示是一个需要反复试验的过程,正因如此,在过去半年,才会有大量类似 PromptHero 和 PromptBase 等提示交流和买卖平台涌现——他们将验证过的提示直接摆在用户面前。
想做一张可爱考拉的图片?下面这则提示或许可以直接拿走。
觉得英语不过关?下面这则提示或许能让 ChatGPT 成为你最好的英语老师。
热闹背后的担忧
不管是科技公司开出的高薪,还是提示交流平台的流行,它们无一不在揭示提示工程是一个被多么看好的领域。
不过,这样的热度也引起了不少争议。
首先,AI 通过提示创作的作品,版权归谁?
目前,通过提示工程生成的作品与大多数版权法的解释相冲突。在美国,当 Jason Allen 对获奖作品《太空歌剧院》申请版权时,版权局拒绝了他的申请,称 " 它不包含任何人类作者身份 "。
其次,提示工程师的高薪值得吗?
" 这可能是泡沫的迹象," 为亚马逊 Alexa 开发语音控制功能的对话设计工作室 labworks.io 的创始人 Tom Hewitson 说, " 最适合做这件事的人是熟悉 AI 的产品设计师或业务分析师,他们的年收入往往在 10 万到 15 万英镑之间。"
最后,提示工程师的职位会存在多久?
不少人认为,提示工程只会成为一种技能,并不需要一个专门的职位。随着 AI 工具在理解人类查询方面变得越来越好,这个职位会变得越来越过时。
沃顿商学院教授 Ethan Mollick 在 2 月份发推文说:" 我强烈怀疑‘提示工程’从长远来看不会有什么大不了的,提示工程师也不是未来会存在的工作。"
剑桥大学机器学习研究主任 Adrian Weller 认为,虽然能够通过提示与 AI 交互 " 具有很高的价值 ",但 " 我不确定它是否会继续下去很长一段时间。不要过多关注提示工程的当前。它会很快发展的。"
尽管提示工程师的职业当前备受瞩目,但它到底能够走多远,恐怕只有时间才能解答了。