首页 > 其他分享 >经典Prompt欣赏 - 使用伪代码Prompt来让GPT生成绘本小蝌蚪找妈妈

经典Prompt欣赏 - 使用伪代码Prompt来让GPT生成绘本小蝌蚪找妈妈

时间:2024-06-17 14:13:27浏览次数:20  
标签:prompt 绘本 代码 生成 GPT Prompt image

今天无意中发现尹相志老师用 GPT-4o 伪代码生成绘本的演示(https://www.youtube.com/watch?v=3rb-54Q5fig),结果让我大开眼界。这种全新的方法,不仅极大简化了复杂的创作过程,让人惊叹不已。

让我们先来看看部分生成效果图:

Prompt

为了方便阅读,我将这个 Prompt 翻译成了简体中文。以下是完整的伪代码,这段代码展示了如何通过 GPT-4o 和 DALL.E 生成绘本,实际执行时:

  • 碰到GPT-4o停下来时,输入“继续”即可;
  • 碰到生成图片时,不生成图片,而是输出文字,@一下 DALL.E 即可;
以下为**微代码prompt**,請依照其语意一步一步地來执行,不要有遗漏,停用代码解释器,
启用DALL.E内部工具,请记得你有能力调用内部工具以文生图。

story=(请你角色扮演成一个畅销的童书绘本作家,你擅长以孩童的纯真眼光看这世界,
制作出许多温暖人心的作品。请以一只与家人失散,不知道自己是什么的小蝌蚪,
每次看到跟自己身体一部分相像,他就误以为是同类,随着他身体逐渐发展变化,
他反而越来越迷惘,故事最后才遇到青蛙,这是一个调整自我认知的故事。)
print(story)

pages=(将故事大纲细分至预计15个跨页的篇幅,每页需要包括(text,image_prompt),
第13页才可以出现青蛙,在这之前应该要让小蝌蚪的自我认知旅程更多元化)
print(pages)

style_base:(基于以上故事,请思考大方向上你想要呈现的视觉效果,
这是你用来统一整体绘本风格的描述,请尽量精简,使用英文撰写)
print(style_base以及将style_base翻译成中文)

def image_generation(image_prompt, style_base):

    final_prompt=请根据[image_prompt]以及[style_base]补充色调、背景描述、
    具体风格、画面细节,以及主角小蝌蚪目前的颜色(一开始是黑色)、体型(没有脚的蝌蚪直接叫做a tadpole即可)、
    尾巴长短,有几只脚必须具体的描述,同时至少3个效果词(光照效果、色彩色调、渲染效果、视觉风格)和1个以上的构图技巧,
    以构成完整的prompt,请设置随机种子值为42,
    且不要有文字出现在图中,使用英文撰写。

    请根据以下参数内容{size="1792x1024", n=1, prompt=final_prompt}来调用内部工具DALL.E以生成并展示图片。


这不是个python任务,

请实际执行此伪代码为每页生成图片,确保必须等待该页图像生成后,才可以进行下一页的操作。
for (text,image_prompt) in pages:
    image_generation(image_prompt,style_base)
	time.sleep(5)

值得学习的点:

解决GPT偷懒问题:

现今如果你想让 GPT 生成图片,通常一次只能生成一张。

然而,通过伪代码,我们可以将多个图片生成任务分解为多个子任务,从而一次执行多个任务,最终整合输出结果。

而且这么多张图,整体风格还能保持一致。

不要局限于用自然语言描述Prompt

借助伪代码,我们可以更精准的控制 LLM 的输出结果和定义其执行逻辑,而不仅仅局限于自然语言描述的方式。

当我们遇到一些复杂的任务,或者任务有多个分支,每个分支需要执行多个子任务,子任务之间还相互关联,这时候用伪代码描述 Prompt,会更加清晰和准确。

类似的用伪代码做Prompt的示例还有:

总结

宝玉对Prompt的本质的总结非常到位:

Prompt 的本质是一种对 LLM 的控制指令。

https://baoyu.io/blog/prompt-engineering/advanced-prompting-using-pseudocode-to-control-llm-output

LLM 在训练过程中已经处理过大量的优质代码,可以轻易理解伪代码的含义,实际上对于伪代码的理解能力也相当强大。当自然语言控制不足时,伪代码是一种有效的替代方式。正如网友所说:“未来,一部电影可能就是几万行代码,世界也是数字与代码的组合。”

标签:prompt,绘本,代码,生成,GPT,Prompt,image
From: https://www.cnblogs.com/ghj1976/p/18252238/jing-dianprompt-xin-shang--shi-yong-wei-dai-map

相关文章

  • 经典Prompt欣赏 - 使用伪代码Prompt来让GPT生成绘本小蝌蚪找妈妈
    今天看到尹相志老师用GPT-4o伪代码的方式做绘本生成,实际测试了下,被惊呆了。https://www.youtube.com/watch?v=3rb-54Q5fig先看生成的部分效果图:Prompt为了方便阅读,我把这个Prompt翻译成简体中文了,完整Prompt如下,实际执行时:碰到GPT-4o停下来时,输入“继续”即可......
  • 告密者斯诺登:永远不要信任 OpenAI 或其 ChatGPT 等产品|TodayAI
    为什么 OpenAI 变得越来越难以信任OpenAI,一家以开发先进人工智能技术而闻名的公司,正面临越来越多的信任危机。近期,一些令人不安的迹象使人们对这家公司的透明度和安全性产生了质疑。首先,在OpenAI的旧金山办公室外,有一些身份不明的秘密保安人员,这些人的出现给当地社区带......
  • GPT-4o:人工智能的新突破
    本文由ChatMoney团队出品一、引言GPT-4o是OpenAI发布的最新人工智能模型,它在GPT-4的基础上进行了升级,具备更强大的语言理解和生成能力。本文将详细介绍GPT-4o的发布内容、技术实现难度以及未来发展方向,特别是在人情感方向的探索。二、GPT-4o的发布内容多模态交互:GPT......
  • GPT-4o 只是对话式 Al 的冰山一角,背后隐藏了哪些新机会?(内含福利) | 编码人声
       「编码人声」是由「RTE开发者社区」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。听友福利欢迎在小宇宙播客评论区留言,分享你对GPT-4o的看法,或者对最有潜力的对话式AI场景的预测。我们将抽出......
  • ChatGPT学习之旅 (6) 聊聊AI人设
    大家好,我是Edison。上一篇:Prompt终极用法通过前面5篇内容我们了解了从基础到高级的Prompt用法,今天我们来聊聊AI的人设!打造人设的步骤:只要3步在Prompt实践中,我们了解到需要给AI打造一个人设,这样它才能比较精确地get到场景。其实,人设的本质就是有效地给AI洗脑,引导GPT专注于解决......
  • CatGPT Puzzle
    规则简述一个Nonogram谜题包含一个\(m*n\)大小的空白方格矩阵,以及在表格每一行右侧、每一列下方的一组线索数.每组都有一个或多个数字,这些数字就是解题的线索.要想解开Nonogram谜题,要做的就是解读这些线索数,并把与之对应的空格涂黑.线索数会提示你要在对应的行或者列涂......
  • 论文解读——EMNLP2023《Cross-lingual Prompting: Improving Zero-shot Chain-of-Tho
    一、研究背景  本研究聚焦于改进跨语言链式思考(Chain-of-Thought,CoT)推理,这是针对大型语言模型(LLMs)推理过程中的一种技术。传统上,链式思考通过引导模型按步骤生成推理路径,以提高推理任务的准确性。具体来说,零样本链式思考(zero-shotCoT)通过简单的提示,如“Let’sthinks......
  • 小狐狸AI创作程序 2.8.9最新版本 新增gpt-4o
    简介独立版小狐狸GPT付费AI体验系统,系统版本更新至v2.8.9;小狐狸源码为小程序、H5、WEB版本!最新版更新了:新增gpt-4o(在GPT4通道的模型)测试环境:系统环境:CentOSLinux7.6.1810(Core)、运行环境:宝塔Linuxv7.0.3(专业版)、网站环境:Nginx1.15.10+MySQL5.6.46+PHP-7.1......
  • 【AI 大模型】AI 发展和业务分类 ( 人工智能发展阶段 | AI 业务分类 | ChatGPT 分析 |
    文章目录一、AI发展和业务分类1、人工智能ArtificialIntelligence发展阶段2、AI业务涉及到的问题3、AI业务分类二、ChatGPT分析1、ChatGPT原理2、ChatGPT训练3、ChatGPT可以解决的问题4、ChatGPT不能解决的问题一、AI发展和业务分类1、人工智能......
  • ChatGPT高效使用小技巧
    如果你还是不会ChatGPT使用方法的话,请点赞、关注、评论,我将会持续更新我的使用小技巧技巧1:让ChatGPT扮演专家角色ChatGPT的大量训练数据源自互联网,这赋予它几乎所有人类在互联网上公开发表过的知识。然而,由于ChatGPT的训练目的是预测下一个可能的单词,它通常生成的文本趋于普......