首页 > 其他分享 >【译】生成考古学:人工智能创建古代世界的真实图像

【译】生成考古学:人工智能创建古代世界的真实图像

时间:2024-01-26 13:23:01浏览次数:30  
标签:考古学 场景 人工智能 美索不达米亚 古代 生成 图像 亚述

原作:Ming

引子:历史令人着迷,但很难想象几千年前的世界是什么样子。

 

许多方面造成了这一困难。部分原因是古代人有不同的审美观。在 1400 年代之前,画家很少考虑透视,使得事物的比例在现代人看来相当奇怪。部分原因是时间已经腐蚀掉了文物中的很多细节。陶器、雕塑和建筑物随着时间的推移而褪色。例如,您知道埃及的吉萨大金字塔是白色的,有一个金色的盖子吗?这些因素使得今天的人们很难准确地领略古代之美。

最近,我了解到人们使用人工智能为过去的场景创建图像。我将这种趋势称为“生成考古学”。

  • 几十年来,一些街头摄影师一直在使用人工智能来拍摄 20 世纪 90 年代中国的真实照片。
  • 几个世纪以来,一些艺术家一直在创作具有戏剧性风格的重要历史场景(例如俄罗斯革命)和重要人物(例如圣女贞德)的图像。

我心想:为什么不把时间拉得更远,回到几千年前呢?

古代美索不达米亚地图

我一直对美索不达米亚历史很感兴趣,所以我决定从那里开始。几个文明在该地区漫游:苏美尔人、亚述人、巴比伦人、阿卡德人等等。我应该从哪里开始?

作为一名游客探索地方时,我总是发现图画地图很有帮助。简而言之,图形地图会降低制图的准确性;作为交换,它展示了重要的兴趣点,例如旅游景点、当地植物和动物以及重要地标。让我们看看 MidJourney 能为我们提供什么。这是我的提示:

[prompt] 公元前 2000 年左右的古代美索不达米亚图画,像鸟瞰图一样稍微倾斜,描绘了乌尔、乌鲁克和巴比伦等重要城市。底格里斯河和幼发拉底河清晰可见。河流和城市都用英语和楔形文字标记。

经过几次改进,这就是我得到的结果:

当然,您不应该相信这张地图适合您的下一次时间旅行冒险。缺陷非常明显:

  • 没有清晰的标签,无论是英文还是楔形文字。
  • 这张地图上没有提到美索不达米亚。我原以为每个城镇至少有一座金字形神塔。
  • 建筑和帆看起来就像外星科技。这到底是什么?

美索不达米亚的鸟瞰图就这么多了。城市里的风景怎么样?

乌尔的一个典型市场

古代美索不达米亚艺术主要是为神灵或皇室成员服务的,尤其是雕塑。我想知道普通人典型的一天会是什么样子。

这是我用 MidJourney 生成的场景:

[prompt] 公元前 2039 年左右苏美尔古城乌尔繁忙市场的照片。前景中,一群不同的人从事着不同的职业,包括一名在泥板上书写楔形文字的抄写员、三名在该地区巡逻的士兵、一名路过的农民和几名出售手工艺品的商人。街角有一家酒吧。窗边,有人正在用吸管喝啤酒。远处,你可以看到金字形神塔。人们穿着适合其职业的传统古代美索不达米亚服装。

多么热闹的小镇啊!你几乎可以听到这张照片中动物和人的噪音。向 MidJourney 致敬,它做得非常出色,包括以下细节:

  • AI在前景中加入了一只山羊。在时间上,美索不达米亚人驯化山羊已有 6000 年历史,完全契合。
  • 街道已铺好。这也是相当准确的——古代美索不达米亚人被认为是第一个铺设道路的文明。
  • 窗户是用木条格栅的。由于考古遗址中的木制物品在被发现时通常已经腐烂,因此很容易被遗忘。 MidJourney 记得将它们纳入其中这一事实值得赞扬。

当然,还有几个方面可以改进:

  • 尽管我要求一张照片,人工智能还是生成了一幅绘画。
  • 我特意要的酒吧啤酒在哪里? 美索不达米亚啤酒因面包屑而变得混浊,人们不得不用芦苇吸管喝饮料,正如《时间之谜》团队的这段视频中所描绘的那样。
  • 远处建筑物顶上那个看起来像断头台的东西是什么?对我来说似乎存在安全隐患。

除了明显的错误之外,还有几点我不确定:

  • 建筑。大多为两层高,顶部平坦。这是相当准确的,巴比伦房屋2600年前的红土模型就证明了这一点。然而,我对房屋维护不善的状况表示怀疑。当他们在此生活居住时,房屋的状况不应该更好吗?
  • 衣服。 确实,长袍和头巾在古代乌尔很常见,但说实话,我期待更多的装饰。

用人工智能生成东西的大部分乐趣在于随机性。您可以拥有无​​限数量同一主题的插图(只受预算限制)。以下是我使用相同提示生成的其他几个场景:

在此图中,我们看到了更多类型的牲畜,包括羊(左下)和牛(右下)。

此版本具有几个不同的细节:

  • 天花板顶部(左中)和地面上(右下)的罐子和篮子,似乎装着某种蘑菇。
  • 各个地方都挂着一串串谷物。看来是丰收的一年啊!
  • 窗户比前两幅画中的窗户小,这也许更准确。

尽管这些画作在美学上令人愉悦,但您可能会说它们只是描绘了所有中东市场常见的通用场景。我们可以强调古代美索不达米亚元素吗?

古亚述帝国的室内设计

1854 年,亚述学家奥斯汀·亨利·莱亚德 (Austen Henry Layard) 为亚述纳斯里帕二世 (Ashurnasrirpal II) 的亚述宫殿的大厅绘制了一幅插图:

这可能是迄今为止最详细(也是最可信)的亚述建筑内部绘画。我把它喂给 MidJourney 让它发挥想象力:

[prompt] 用单反摄影重新粉刷这个房间。这是亚述纳斯里帕二世 (Ashurnasrirpal II) 亚述宫殿的一个大厅。这是来自古代亚述帝国。与巴比伦文化、阿卡德文化、苏美尔文化相似,它们都来自美索不达米亚。

在手动挑选图像约 5 次迭代后,我得到了这张图片:

这么多柱子! 在我看来,这个场景中显示的柱子像是埃及风格和波斯风格的完美结合,并大量应用了蓝色。 这个颜色让我想起了伊什塔尔门的釉料,在阳光下看起来应该相当闪亮。 在古代,青金石以其闪亮的蓝色而闻名。 考虑到青金石的稀缺性,古代亚述人可能将蓝色与较高的社会地位联系在一起,从而解释了蓝色在宫殿中的使用。 相比之下,莱亚德的画没有柱子,这是人工智能的创造性发明。

就像莱亚德的画一样,这幅生成的艺术品在墙上描绘了浮雕。 浮雕是古代美索不达米亚雕塑艺术的常见形式。 具体来说,我喜欢人工智能在左侧墙上的浮雕之上放置第二排浮雕(在面向我们的墙上)。 不过,我希望这些数字能更清晰一些。

给生活带来一丝安慰

说到浮雕,既然我们已经做到了,为什么我们不尝试从浮雕中生成对某人的真实描绘呢?

这幅来自尼努尔塔神庙的浮雕被大都会博物馆收藏,描绘了一个长着翅膀的男人,也许也是一位神,其名不详:

我让 MidJourney 将他想象成一个真实的人:

[prompt] 这个人可是在现实世界的照片中。他有翅膀。他左手握着一株植物的一部分,这株植物的三个枝条末端都是莲座丛。这个人物来自古代亚述帝国。与巴比伦文化、阿卡德文化、苏美尔文化相似,它们都来自美索不达米亚。

这已经相当不错了!面部特征捕捉得非常好。他看起来也更有权威:

  • 他不再用左手向下握住枯萎的玫瑰花结,而是像权杖一样将植物高高举起。
  • 他的衣服更加对称(尽管人工智能再次未能捕捉到褶边)。

不过,整件事看起来仍然像一座雕塑。如果你看看他的翅膀和衣服,很难想象他是如何飞的,甚至是走路的。尽管如此,这与他以前在圣殿里的样子相比,已经是一个巨大的飞跃了。

后记

简要回顾一下。在这篇文章中,我展示了一些人工智能生成的关于古代亚述的艺术作品。从航空地图的例子中,我们看到人工智能在执行以下任务时惨败:1)需要关注太多细节,2)缺乏足够的训练数据(我想图画地图在古代美索不达米亚并不是很流行)。另一方面,它在历史上艺术家充分探索的主题(即市场)、细节较少的场景(即室内)和单身人士肖像方面表现出色。

规划

接下来,我计划扩展生成古代人物肖像的想法。例如:在 1882 年的 Lookbook Costumes of All Nations 中,第 4 页“古代”一章中描绘了战前亚述军队的场景:

这个插图非常逼真,看到真人穿着这些服装是不是很酷?

意义

“生成考古学”具有巨大的教育价值。 许多人有兴趣了解古代文化,但插图的稀缺和历史文物的获取(想想:发掘现场、博物馆、古董店……)可能会阻碍他们的好奇心。 这对年轻人来说更为严重,因为场景经历构成了想象力!。

借助生成式人工智能,一切都会变得更好。 我们可以把草图变成栩栩如生的图画。 在艺术为权贵保留的时代,我们可以展示普通公民的生活是什么样子。 通过将人工智能技术引入历史教育项目,我们将迎来令人兴奋的可能性。

标签:考古学,场景,人工智能,美索不达米亚,古代,生成,图像,亚述
From: https://www.cnblogs.com/Leap-abead/p/17989106

相关文章

  • 人工智能 第2章 课后习题
    人工智能第2章课后习题讨论题1.搜索为什么是AI系统的重要组成部分?人工智能中的搜索指依靠经验,利用已有知识,根据问题的实际情况,不断寻找可利用知识,从而构造一条代价最小的推理路线,使问题得以解决的过程,是AI系统的核心内容。2.状态空间图是什么?状态空间图是对问题的一种表示......
  • 人工智能(第3版) 第二章—学习笔记
    人工智能(第3版)第二章—学习笔记2.0简介:智能系统中的搜索这一部分内容简单的列举了我们生活中出现的一些常见的搜索问题,并简单介绍了本章之后需要学习的状态分析图,生成——测试搜索范式,盲目搜索算法,贪心算法和回溯法等内容。2.1状态空间图状态空间图(state-spacegraph)是对......
  • 基于FPGA的图像RGB转HSV实现,包含testbench和MATLAB辅助验证程序
    1.算法运行效果图预览 将FPGA的仿真结果导入到matlab中:   2.算法运行软件版本vivado2019.2 matlab2022a 3.算法理论概述       在数字图像处理中,色彩空间的转换是常见的操作。其中,RGB和HSV是两种经常使用的色彩空间。RGB基于红、绿、蓝三种颜色的组合......
  • 基于FPGA的图像RGB转HLS实现,包含testbench和MATLAB辅助验证程序
    1.算法运行效果图预览 将FPGA结果导入到MATLAB显示效果: 2.算法运行软件版本Vivado2019.2 matlab2022a 3.算法理论概述       在数字图像处理中,RGB和HLS是两种常见的颜色空间。RGB基于红绿蓝三种基本颜色的叠加来定义其他颜色,而HLS则代表色调、亮度和饱和......
  • 读论文-基于注意力机制的浅层图像隐写分析模型
    前言今天要读的论文是一篇名为《基于注意力机制的浅层图像隐写分析模型》,文章提出了一种基于注意力机制的浅层图像隐写分析模型,通过使用一个浅层神经网络控制模型参数量和训练时间,引入注意力模块,加速模型收敛,提升模型检测的准确率。要引用本文:请使用如下格式:段明月,李爽,钟小......
  • I帧与IDR帧:H.264编码中的“图像守护者”
    目录导语I帧:图像传输的“基石”IDR帧:图像传输的“革新者”专业数据分析总结导语在数字视频传输领域,H.264编码标准是业界广泛采用的编码技术之一。H.264编码中的关键概念包括I帧和IDR帧。这两种帧在视频传输中扮演着“图像守护者”的角色,它们各自承担着不同的任务,共同确保视频数......
  • 人工智能 第三版 第二章笔记
    人工智能第三版第二章笔记空间状态图状态空间图(state-spacegraph)是对问题的一种表示方法。其中有两种特殊类型的节点。其中一种是表示问题起始状态(startstate)的起始节点(startnode)。另一种特殊类型的节点对应于问题的终点或终止状态。问题的状态空间树包含了问题可能出现......
  • 2024年世界经济论坛年会,人工智能议题引发热议
    2024年1月15日至19日,瑞士达沃斯举办了第54届世界经济论坛年会。此次论坛汇聚了来自120个国家的2800多位各界领导者,共同探讨和推动国际合作,围绕“重建信任”这一主题讨论经济增长、气候与自然行动、能源安全、技术治理和人类发展等重要议题。论坛设置了包括世界安全合作、创造就业机......
  • 【图像处理基础】灰度图raw8格式转NV12格式
    前言 转换原理*RGB转YUV-NV12:Y=0.299R+0.587G+0.114BU=-0.1687R-0.3313G+0.5B+128V=0.5R-0.4187G-0.0813B+128*YUV-NV12转RGBR=Y+1.402(V-128)#1.4075G=Y-0.34414(U-128)-0.71414(V-128)B=Y+1.772(U-......
  • 人工智能与机器学习在工业质量检测中的融合发展
    人工智能与机器学习在工业质量检测中的融合发展随着科技的进步,人工智能和机器学习已经成为引领工业质量检测变革的重要力量。它们在工业领域的应用,不仅提高了检测的准确性和效率,也为企业带来了前所未有的发展机遇。一、机器学习在工业质量检测中的优势机器学习技术可以通过训练模......