首页 > 其他分享 >刚爆火就下线的 ZAO 换脸,背后是另一场技术人的狂欢

刚爆火就下线的 ZAO 换脸,背后是另一场技术人的狂欢

时间:2023-08-11 23:39:27浏览次数:38  
标签:ZAO 识别 图像识别 特征 卷积 神经网络 图像 爆火 换脸

8月31日晚上,一个名为“ZAO”的AI换脸APP刷爆朋友圈!

一场技术人员的狂欢又拉开帷幕。APP原理很简单,用户只需要上传一张照片,就能把自己或其他人替换为“吴彦祖”、“彭于晏”、“玛丽莲梦露”以及你想要看到的任何人。你懂的!当然,也由此诞生了一场舆论的漩涡!

今天我们不讨论舆论,我们聊聊技术!

刚爆火就下线的 ZAO 换脸,背后是另一场技术人的狂欢_神经网络

在人工智能发展迅速的今天,机器越来越“聪明”了!

机器跟人一样,有了获取信息的能力。能轻松的把一张图片替换为另一张图片,具体原理是如何发生的呢?我们得先从图像识别开始说起!

我们人类识别图像都是依靠图像所具有的本身特征而先将这些图像分类,然后通过各个类别所具有的特征将图像识别出来的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。

A    P   Y

当我们看一个物体时,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,抽出关键特征,排除无关信息是最重要的。

机器的图像识别技术也是如此,通过分类并提取重要特征而排除多余的信息来识别图像。图像识别技术的过程分以下几步:

刚爆火就下线的 ZAO 换脸,背后是另一场技术人的狂欢_图像识别_02

信息获取,预处理基本就是字面意思,特征抽取和选择前文已经提到过。这里就着重谈谈分类器设计。

分类器设计是指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别技术能够得到高识别率。分类决策是指在特征空间中对被识别对象进行分类,从而更好地识别所研究的对象具体属于哪一类。

比如卷积神经网络图像识别技术是一种比较新型的图像识别技术,是在传统的图像识别方法和基础上融合神经网络算法的一种图像识别方法。这里的神经网络是指人工神经网络,也就是说这种神经网络并不是动物本身所具有的真正的神经网络,而是人类模仿动物神经网络后人工生成的。

刚爆火就下线的 ZAO 换脸,背后是另一场技术人的狂欢_神经网络_03

卷积神经网络也是通过一些可供“调教”的参数,分层处理图片以便实现某些目的,例如目前应用最为广泛的物体识别,图片分类,也可以用于图片降噪或去模糊。

刚爆火就下线的 ZAO 换脸,背后是另一场技术人的狂欢_图像识别_04

也正如其他的人工智能神经网络一样,卷积神经网络的运行方式是前向分层处理。一张图片相继通过神经网络的各个分层,最后一层产生的图片即为最终结果。每一层都有一组参数,在运行过程中被不断训练。这些可调教的参数决定了每个“过滤层”的功能。图像每经过一个“过滤层”都会产生一组“滤后图像”,每一张“滤后图像”都代表了原始图像的某一特征(边缘、角度、轮廓等)。

通常,当一张图像经过了多层过滤之后,后面留下的特征会越来越抽象。

例如,如果卷积神经网络被训练用于物体识别,更深层次的“过滤层”更能“感知”到物体的存在而非具体的像素值。

经过多年发展,用于物体识别的卷积神经网络表现已经越来越好,挑战门槛也越增越高。机器学习在互联网应用中已经无处不在:

Facebook利用它来决定哪条新闻出现在你的时间线上;

Google图片用它来做面部识别;

微软的Skype Translator利用机器学习把演讲实时转换成不同的语言;

Google还利用DeepMind 为它昼夜运行的数据中心节能降耗。

而基于深度神经网络的人脸识别技术已经广泛应用于线下的身份认证。

图像识别及图像处理等应用目前占据了人工领域领域80%左右的市场份额。针对很多准备切入人工智能领域的程序员来说,图像领域确实是一个起步门槛相对较低的方向。之前我们也分享了很多关于图像识别领域的技术分析文章,大体上跟大家讲解了一些图像识别涉及到的技术要点。


标签:ZAO,识别,图像识别,特征,卷积,神经网络,图像,爆火,换脸
From: https://blog.51cto.com/csnd/7053712

相关文章

  • 中电金信:ChatGPT一夜爆火,知识图谱何以应战?
          随着ChatGPT的爆火出圈  人工智能再次迎来发展小高潮   那么作为此前搜索领域的主流技术     知识图谱前路又将如何呢?  事实上,ChatGPT也并非“万能”,作为黑箱模型,ChatGPT很难验证生成的知识是否准确。并且ChatGPT是通过概率模型执行......
  • AI 换脸、声音篡改等,明确写入新版《民法典》
    By超神经内容提要:在近期两会中刚刚表决通过的《中华人民共和国民法典》中第四编人格权中的第四章肖像权,明确提出了以信息技术手段,对于他人肖像、声音等权益的侵害认定。关键词:民法典 AI换脸 Deepfake5月28日,十三届全国人大三次会议表决通过了《中华人民共和国民法典》(以下......
  • roop 视频换脸
    roop:oneclickfaceswap.只用一张人脸图片,就能完成视频换脸。项目地址:https://github.com/s0md3v/roopColab部署:https://github.com/dream80/roop_colab本文是本地部署的实践记录。环境基础OS:Ubuntu22.04.2LTSKernel:5.19.0CPU:Intel(R)Core(TM)i7-1075......
  • Github一夜爆火的阿里术小册究竟有什么魅力?才能引大家趋之若鹜
    前言谈谈我的真实感受吧~程序员真的是需要将终生学习贯彻到底的职业,一旦停止学习,离被淘汰,也就不远了。金九银十跳槽季,这是一个千年不变的话题,每到这个时候,很多人都会临阵磨枪,相信不快也光。于是,大家都会搜集一些面试题。但其实,对于一些不跳槽的同学来说,真的也很有必要去研读一些大厂......
  • AI绘画:最新SDW+单图换脸+单图说话+汉化 软件包!!!
    Stable-Diffusion-WebUI是个好东西。   除了基础的AI绘画功能之外,可以通过,模型,Lora,插件进行无限扩展。很多生成类AI都提供了SDW插件。比如,可以用一张图片就实换脸的Roop,某些场景比Lora还好用。​比如,可以让图片开口说话的SadTalker,快速......
  • 爆火的2022版腾讯Android面试手册,最新最细致,终于拿到手了
    据腾讯HR部门6月8号发布的最新信息,2022年6月Android开发岗位数将同比增长21%,伴随应届生求职季的到来,想进腾讯的小伙伴竞争会异常激烈。面试的深度和难度将不断增加,很多想进腾讯的朋友都在问,如何准备才能顺利拿下offer?第一章Java基础静态内部类和非静态内部类的比较多态的理解与应......
  • 又一开源项目爆火于GitHub,Android高级插件化强化实战
    一、插件化起源插件化技术最初源于免安装运行Apk的想法,这个免安装的Apk就可以理解为插件,而支持插件的app我们一般叫宿主。想必大家都知道,在Android系统中,应用是以Apk的形式存在的,应用都需要安装才能使用。但实际上Android系统安装应用的方式相当简单,其实就是把应用Apk......
  • AI换脸视频换脸流量主小程序开发
    AI换脸视频换脸流量主小程序开发AI转动漫、AI视频换脸、AI绘画、AI换脸。支持多种盈利模式·点数充值,多种点数充值,让用户自由选择。激励视频,接入抖音、微信等流量主广告。多种风格可选,内容丰富,趣味性十足,增加用户使用粘度,男生、女生、文艺、炫酷、唯美、爱情。支持小程序一键上传......
  • Roop:单图换脸离线版软件包及使用方法!
    你们要的“单图换脸”离线一键运行版来了。Roop发布几十个小时后,马不停蹄地搞了Colab在线版。其实这东西都挺好的,又快又方便,几乎没有任何硬件要求,点一点就可以搞定了。但是它有一个问题,就是没有“魔法”就没法使用。(有魔法但是换不出来的,请反思你们的素材是不是“纯洁无暇”!),我估......
  • ps如何换脸无痕迹
    第一步打开PS软件,找两张照片直接拖进去第二步选择套索工具将霍建华的脸圈起来,Ctrl+J复制出来,第三步Ctrl+J复制的照片,Ctrl+T将霍建华的脸调整好大小贴到胡歌脸上,对齐好。建议:在贴图的时候,先调一下透明度,这样可以更快更齐的贴好。第四步按住Ctrl键点击霍建华的脸部图层,......