提示工程师分享使用ChatGPT、Midjourney、Bing Chat和其他生成式人工智能的技巧

Featured 人工智能

题图:杰森·艾伦的人工智能作品《空间剧场》在科罗拉多州博览会上获得数字类第一名。(提供:杰森·艾伦)

【澳纽网编译】七个月前,当杰森·艾伦使用一种新的生成人工智能(AI)程序在科罗拉多州赢得一场艺术比赛时,他立即被指控作弊。

当时,很少有人使用过这些工具,也很少有人知道他做了什么。ChatGPT还没有启动。

在此之后的一段时间里,发生了显著的变化。这些工具已经变得广泛流行,围绕着如何最好地使用它们,一个行业如雨后春笋般涌现出来。

而不是“作弊”,这种技能有另一个名字:“提示工程”(”prompt engineering”)。

广告 | Advertisement

在澳纽网做广告 | Advertise with us

目前,招聘网站上已经刊登了招聘工程师的广告,而澳大利亚的营销公司正在寻找“ChatGPT的诀窍”。许多专家表示,知道如何与人工智能程序对话以获得最佳结果将是一项基本技能,就像电子邮件或谷歌。

这种新发现的对快速工程技术的重视与版权法的解释发生了冲突。美国当局最近拒绝了艾伦为其获奖图像申请版权的申请,称“它不包含任何人类作者”。

“我以为我们会沉浸在人工智能的庆祝活动中,”总部位于科罗拉多州的艾伦在谈到这一形象的创作时说。

“相反,我有点像那个打开潘多拉魔盒的人。”

那么,什么是提示工程(prompt engineering)?

这种新技能的需求量会有多大?

学习权力的话语

现在大多数可用的人工智能工具要么生成文本,比如ChatGPT,要么生成图像,比如Midjourney。

其他一些人做文本到歌曲,文本到视频,等等。

必应聊天人工智能是一个例外。它是多模态的,这意味着它可以从文本提示符生成文本和图像。

首先,让我们关注文本到图像的生成。

为了理解如何与人工智能程序沟通,我们需要了解一点它是如何工作的。

从文本到图像的人工智能程序已经在从互联网上刮下的大量图像以及任何相关文本上进行了训练。

例如,从虚幻游戏引擎的一个论坛上抓取的图像将被自动标记为“虚幻”(以及其他单词,如标题)。

广告

Advertise with us

因为很多图像都有这个标签(Unreal是一个流行的引擎,所以有很多图像),所以“Unreal”这个词在AI训练数据集中有“权重”。

这个权重使得这个词对人工智能程序来说是一个强有力的提示,产生了某种可预测的美感。

An AI-generated image showing an underwater civilisation.
包括提示“虚幻”生成一个图像,看起来像游戏概念艺术。(提供:PromptHero)

任何与电影摄影、艺术指导、平面设计和艺术评论相关的词汇都是如此。

然而,并没有明确的指南或手册来说明什么样的提示有效,或者有什么样的效果。相反,学习如何与人工智能对话是一个不断试错的过程。

​ 自从Midjourney等程序问世以来的几个月里,致力于剖析和分享人工智能提示秘密的社区在网上涌现出来。

其中最大的一个是PromptHero。从9月份开始,已经有15万用户,其中一万个是活跃的。

“我发现了这个问题,当你第一次尝试用这个来完成某件事时,你通常做的第一件事是相当糟糕的,”总部位于葡萄牙的联合创始人哈维尔·拉米雷斯(Javier Ramirez)说。

“你需要用正确的方式提示,才能得到高质量的输出。”

他把我们介绍给社区的一个成员,一个住在美国中西部的人,他喜欢通过他的平台英雄个人资料JH awk来识别。

A woman in silhouette against a rainy city street
提示包括“模拟风格”和“佳能EF 50毫米f/1.8 STM镜头”。

比如上面这张图片,是在稳定扩散中用一个由15个提示短语组成的字符串,从“模拟风格”到“赛博朋克”。

JH a wk还使用了31个负面提示,描述了图像不应该包含的内容,从“恶心”到“画得不好的脚”。

JHawkk说,人工智能艺术的诀窍是知道正确的词汇。就像工程师把设计转化成数学数字一样,他把图像的离散美学元素(“射线追踪”、“边缘照明”)转换成模型的独特语言。

有时候你看到一个图像,于是你开始把这些图像分解成更小的短语,“他说。

“从本质上讲,这是你如何描述那个图像,特别是以实际模型本身可以解释的方式。”

广告 | Advertisement

在澳纽网做广告 | Advertise with us

《空间剧场》的制作

杰森·艾伦说他“永远不会”分享他获奖形象“空间剧场”的一连串提示,但他愿意谈论创作的过程。 

和J Hawk一样,他从学习正确的单词开始。

“我想创造一个电影场景,就像你在电影里看到的那样,”他说。

“所以我上网找了一个关键词字典,里面有所有和电影摄影相关的东西。我基本上是在学习成为一名电影摄影师。”

他花了“几个星期”测试Midjourney中的不同美学元素,直到他有信心可以准确地复制图像他想象着。

我们在寻找你脑海中浮现出来的结果,并在最后一块看到它。“

An AI-generated "space opera" scene
杰森·艾伦在科罗拉多州博览会美术比赛的其他作品之一。(提供:杰森·艾伦)

然后是介绍主题的时候了。

我当时处于催眠状态我半睡半醒,这些女人穿着维多利亚时代的服装,头戴太空头盔,半梦半醒。“

他想把19世纪英国维多利亚时代的时尚和星球大战般的太空歌剧的浪漫和情节结合起来。

然后,他通过调整提示,在这个主题上做了许多变化。

所有这些,他花了大约80个小时的工作完成了参选作品。

An AI-generated space opera scene
杰森·艾伦的另一部“太空歌剧”参加美术比赛。

艾伦已经聘请了一名律师,对美国版权局不授予版权的决定提出上诉,称其不理解人工智能“只是一个工具”。

“你在说什么?是一个人吗?因为那不是一个人我就是那个人”他说。

https://all24x7.com复制到浏览器上打开

“别再把用户扔到公共汽车下面了。

“我们都有自己的创意梦想。我们都有自己的想法。没有这些,人工智能就什么都不是。”

人工智能语音员工资335,000美金

虽然图像生成器的提示涉及以不可预测的方式将主题元素混合在一起,但文本生成的提示非常不同。重点更多的是给出一套非常清晰的指令。

在伦敦,Mishcon de Raya律师事务所正在寻找一名快速工程师,能够“为一系列法律和非法律用例设计和开发高质量的提示”。

该公司首席战略官尼克韦斯特(Nick West)表示,其中一个“用例”可能是分析合同。

“GPT4的突破和ChatGPT的聊天位的结合,一下子让这里成为了一个非常吸引人的空间。

“我相信我们将能够做一些我们原本无法做的事情。”

但首先,公司需要一个能干的工程师。

“事实证明,有更好的方式来写提示,也有不太好的方式来写提示。

“这就是提示工程学。”

在旧金山,科技公司Anthropic提供高达33.5万美元(500,000美元)的薪水给一名工程师。

广告上写道:“这是编程、指导和教学的混合体。”

Anthropic的技术人员马特·贝尔(Matt Bell)表示,公司已经收到了1000多份回复。

尽管编码知识和机器学习背景很有帮助,“提示本身并不需要编码背景,”他说。

“事实上,我们最好的提词者是一位哲学家。

“好的提示包括写非常清楚的解释……并找出误解的原因以及如何防止它们。”

广告

Alpilean 是一种纯天然减肥补充剂,旨在帮助个人自然减肥。试一下 Alpilean 

在澳纽网做广告 | Advertise with us

如何与ChatGPT或Bing聊天人工智能交谈

阿德莱德大学澳大利亚机器学习研究所(AIML)高级讲师Lingqiao Liu 刘凌桥(音译)表示,良好的快速工程的关键是将一个复杂的任务分解为一组简单的任务。

像ChatGPT这样的程序往往会陷入他所谓的“简单模式”。如果你问它一个简单的问题(被称为“零距离提示”),它通常会用一个“香草”的答案来回答,缺乏细节或结构。

写一篇关于食火鸡的介绍。

食火鸡是一种大型的不会飞的鸟,原产于澳大利亚和巴布亚新几内亚的热带森林。它被认为是世界上最危险的鸟类之一,由于其强大的腿,锋利的爪子,和侵略性的行为。凭借其惊人的外观和独特的特点,食火鸡吸引了世界各地许多人的注意。在这篇文章中,我们将深入到鹤鸵的迷人世界,探索它的身体特征、栖息地、行为、饮食和保护状况。尽管鹤鸵有着可怕的名声,但它作为种子传播者和捕食者在生态系统中发挥着重要作用,因此保护这种标志性物种免受栖息地丧失和狩猎等威胁至关重要。

但也有办法鼓励它做更多的事情。

“总的理念是,我们试图找到一个更聪明的方式,让GPT探索更多的可能性,”刘博士说。

一种方法是“一次性提示”。通过给出一个问答对的例子,给人工智能快速解释你需要什么。当你问下一个问题时,人工智能会使用这个答案模板。​


问题:食火鸡是什么?答案:快速统计:食火鸡被认为是世界上最危险的鸟类之一。特点:它们体型巨大,腿有力,爪子锋利。他们住在哪里:澳大利亚和巴布亚新几内亚的热带森林。他们吃什么:食火鸡是杂食动物,这意味着它们吃植物和动物的物质。濒危状态:南鹤鸵被国际自然保护联盟列为濒危物种。北鹤鸵被列为易危物种。问题:

笑翠鸟是什么?

答:快速统计:笑翠鸟是一种原产于澳大利亚的受人喜爱的鸟类,以其独特的叫声而闻名,它的叫声听起来像沙哑的笑声。特征:体型巨大,喙有力,体格粗壮。他们住在哪里:遍及澳大利亚,主要分布在桉树林和林地,以及郊区,它们经常在树洞里筑巢。它们吃什么:食肉动物,它们的食物包括昆虫、小型哺乳动物、爬行动物和鸟类。濒危状态:笑翠鸟被国际自然保护联盟列为最不受关注的物种。

另一种方法称为角色提示。为人工智能提供一个与您想要接收的答案形式相匹配的角色。

用大卫·爱登堡的风格向我解释这只强大的猫头鹰。


啊,强大的猫头鹰,澳大利亚最壮观的猛禽之一。凭借其锐利的黄色眼睛和令人印象深刻的翼展,强大的猫头鹰在其居住的森林中赢得了尊重。这种非凡的生物可以长到65厘米长,重达1.4公斤,是世界上最大的猫头鹰物种之一。这种强大的猫头鹰遍布澳大利亚东部和东南部,从昆士兰北部到塔斯马尼亚。它喜欢把家安在高大的桉树林里,在那里它可以很容易地捕捉到它喜欢的猎物,如负鼠和滑翔机等小型哺乳动物,以及鸟类和昆虫。尽管体型庞大,力量强大,但这种强大的猫头鹰也以其温和的天性和对幼仔的关爱而闻名。

第三种方法是引入关键剂。例如,你可以让ChatGPT写一个关于机器人的故事,然后让它用自己的建议批评和重写这个故事。

批评下面的文字,说服我为什么它不好。让我们一步一步来思考课文的问题。


首先,文本缺乏一个引人入胜的开头。作者可以用一个开场白(a hook)或一个问题来吸引读者的注意力。其次,对强大的猫头鹰的物理属性的描述有点平淡无奇和通用。虽然提到它的大小和重量是信息性的,但作者可以添加更多有趣的细节,使描述更吸引人和迷人。第三,作者可以包括更多关于猫头鹰的行为和生活方式的信息,例如它们的筑巢习惯或社会行为。这会让读者对这只强大的猫头鹰的生活有一个更完整的了解,并使文本更有趣。最后,关于猫头鹰的危险性和保护的必要性的讨论让人感到匆忙和附加。作者本可以在这一点上展开,解释它们衰落的具体原因,以及正在采取什么措施来保护它们。总的来说,虽然文本提供了一些关于强大的猫头鹰的基本信息,但它缺乏引人入胜的描述和详细的信息,这将使它更有趣和翔实。

好点评。重写文本,并根据你的批评改进它。

强大的猫头鹰是澳大利亚标志性的猛禽,以其令人印象深刻的大小和独特的特征而闻名。长可达65厘米,体重可达1.4公斤,是世界上体型最大的猫头鹰种类之一。它锐利的黄色眼睛和令人印象深刻的翼展在高大的桉树林中赢得了尊重,它更喜欢在那里安家。 【答案继续】

最后一个策略是“思维链”,这是一种鼓励人工智能通过一个复杂的问题进行推理的方法,要求它列出达到答案所采取的步骤。

与其让它“写一篇澳大利亚鸟类的介绍”,不如让它先为这个主题“写一个介绍的提纲”,这样会得到更好的结果。然后,让它按照那个大纲。

请根据大纲写一篇介绍澳大利亚鸟类的文章。

当然,这里有一个介绍澳大利亚鸟类的基础上提供的大纲:

澳大利亚是一个令人难以置信的多样性鸟类的家园,其中许多是在地球上其他地方找不到的。澳大利亚有800多种鸟类,是赏鸟者的天堂。从雄伟的猛禽,如楔尾鹰和强大的猫头鹰,到独特的不会飞的鸸鹋和标志性的笑翠鸟,这里不乏迷人的鸟类等待你去发现。【答案继续】

安娜·伯恩斯坦(Anna Bernstein)是人工智能文案服务copy.ai的全职提示工程师,她说她的主要秘诀是“清晰”。

“如果你把你的输入打印出来,交给《星际迷航》的Data,他会怎么做?”现居纽约的伯恩斯坦说。

“你需要注意你如何引用东西,如何给东西贴标签,如何给出指示。”

另一个建议是,“在动词本身中包含你任务的主要焦点。”

“与其说‘把它重写得更短’,不如说‘压缩它’更有效、更连贯。”

“Instead of ‘Rewrite this to be shorter,’ it’s more effective and consistent to say ‘Condense this.'”

最后,避免负面命令。不要说“不要过于正式”,而要说“保持随意”。

Finally, avoid negative commands. Instead of saying, “Don’t be overly formal”, say “Keep it casual”.

伯恩斯坦表示:“人工智能在被告知不要想象粉红色的大象时,往往会想到粉红色的大象。”

她的其他诀窍不得不保密。

“不幸的是,我的很多发现都是(知识产权),不能分享。”

广告 | Advertisement

在澳纽网做广告 | Advertise with us

提示工程会成为一种标准技能吗?Will prompt engineering become a standard skill?

一些人认为,提示工程永远只会是一种专业技能,随着人工智能工具在解释人类查询方面变得更好,它将变得越来越过时。

例如,HTML的知识不再是做一个基本网站所必需的,就像90年代那样。

其他人说,提示工程将成为白领工人的一项基本技能,使用这些工具将融入许多日常工作。

刘博士的立场介于这两种预测之间:他说,提示工程将是一种标准技能,但有些人会比其他人更擅长。

对一些人来说,这是一种专业技能,比如会编程。

“程序员的关键技能实际上不是写代码。重要的技能是如何将一个复杂的任务分解成多个任务的序列,”他说。

“这种技能将转移到提示工程。”

米什孔德拉亚(Mishcon de Raya)的韦斯特对未来也有类似的看法。

“GPT 4或其他模型中的基本功能是完成这项工作所必需的,就像使用Word或其他任何必需的高级功能一样。

“不过,再说一遍,我们就在山脚下,没人知道。”

原文来源:ABC科学

广告

Advertise with us

 

 983 views

Tagged