“她”来了，陪伴赛道巨变！为GPT-4o加上你的一个数字分身

时间：2024-05-16 16:53:28浏览次数：26

OpenAI的每次发布，感觉都会干翻一个行业。昨晚GPT-4o的发布，情感陪伴这个赛道像是又要掀起一番惊天巨变。各位创业老板们摩拳擦掌，无数创意精英又要踏入新的征程。

开源社区一定也异常兴奋，相信Huggingface和Github马上又会孕育出新宠，大家都期待做出AI时代的Super App，至少也要是一个Killer App，正如去年暑假大红大紫的妙鸭相机和当下的Kimi Chat。而Remini刚刚推出的黏土风格和jada风格的滤镜，又掀起了图片创作的小高潮。

彼时，10块钱的妙鸭相机横空出世，9块9就能制作出自己的数字分身，平均排队时间竟然超过了5个小时。而短短4个月之后，开源文生图平台Stable Diffusion WebUI上就已经支持类似的功能，甚至还支持了简单的文生视频和换装，在4090上轻松实现了设计自由。一些算力平台迅速跟进，例如AutoDL和Lanrui上，都可以找到现成的镜像，一键启动。笔者近期就在京东云新发布的智算平台上，尝试了这个名为EasyPhoto的SD插件，之所以选择京东云平台，无它，唯价低耳！（顺便说一嘴，加它们微信小助手，可以领取2小时的优惠券）。

恰好昨晚OpenAI发布会，就当作蹭蹭热度，为GPT-4o加一个数字分身。

先上图，我试了三个功能，包括数字分身（类似秒鸭相机生成海马体照片），多人换脸，以及文生视频，效果都相当不错。

这是数字分身效果

这是多人换脸的效果：

这是生成视频的效果：

下面介绍下怎么一步一步使用sd-webui-EasyPhoto来完成上面的创作的。

插件的代码路径为：
https://github.com/aigc-apps/sd-webui-EasyPhoto

为了省钱，我选择了使用京东云的智算平台进行安装，因为已经默认安装了Stable Diffusion WebUI，所以只需要安装插件就行。这个平台的使用和其他家类似，注意启动实例时，记着要选择Stable Diffusion应用，待实例运行后，在操作栏-应用，点击Stable Diffusion就能打开Stable Diffusion的页面。

在Extensions选项卡中，点击Install from URL，输入插件的代码路径，点击Install，稍等几分钟，这个插件就安装好了。

安装完成后，就能在页面看到EasyPhoto的标签栏了。需要在Setting标签页中将ControlNet unit number设置为4，点击Apply settings，最后Reload UI。

在EasyPhoto标签栏下，找到第一个Train标签，根据提示，上传5～20张你自己的半身照片，点击Start Training开始训练，会提示你输入一个userid，然后就开始训练了，训练过程大概会持续25分钟左右。

右边的参数不用调整，直接使用默认的就行。训练完的模型，会保存
/data/apps/stable-diffusion-webui/outputs/easyphoto-user-id-infos目录下，有兴趣的同学可以从JupyterLab的终端，或者使用SSH登陆进行查看。

数字分身训练完成后，就可以使用模型进行各种好玩的创作了。例如第二个标签就是照片换脸（Phote Inference），可以选择平台自带的模版，也可以自行上传一个明星照片进行换脸，在下方选择刚刚生成的你的数字分身ID，点击右侧的Start Generation，等待大概5分钟，就能生成一张你的明星照片了。如果你训练了多个数字分身模型，也可以选择多脸替换，这样可以创作出一些搞笑的CP照。

在右侧的Video Inference窗口，可以进行视频生成创作。虽说生成的效果和Sora还是有很大差距，但对很多场景，已经够用了。操作很简单，先选择一个视频场景，然后选择你的数字分身UserID，点击Start Generation按钮就开始生成了。

我们可以试着调整下Prompt，以获得更好的场景描述，可以点击左下角的高级选项，调整下视频的格式和长度，默认为gif格式，可以改为MP4格式，设置Video Max num of frames为视频的长度（秒数）* Video Max fps，这样就可以生产长视频了。

这就是最简单的EasyPhoto的入门教程了，大家可以亲自上手实践下，探索更多有趣的玩法，反正有2个小时代金券可以白P

标签：赛道,视频,插件,EasyPhoto,数字,4o,点击,GPT,分身
From： https://www.cnblogs.com/Jcloud/p/18196240

GPT-4o
跳至主要内容研究产品安全公司 2024年5月13日你好GPT-4o我们宣布推出GPT-4o，这是我们的新旗舰模型，可以实时对音频、视觉和文本进行推理。贡献尝试ChatGPT （在新窗口中打开）在游乐场尝试（在新窗口中打开）重新观看现场演......
How to subscribe to GPT4?
如何在没有海外银行卡、海外手机号的情况下注册GPT4？概述：注册美区AppleID，使用礼品卡充值。免责声明：这个过程在理论上是被Apple禁止的，仅能够保证的是截止2024.5这套方法还在生效。由于账号被封导致的问题概不负责。材料：一台Apple设备。一个没有注册过AppleID（或者只注......
OpenAI最新模型GPT4o十个牛逼的应用场景！
OpenAI真是要压着谷歌打么？哈哈！直接赶在谷歌之前开了一个新品发布会。今天凌晨直播，早上一起来就发现已经可以体验新模型了。从录播内容来看，并没有传言的GPT5，也没有所谓的搜索功能。但是，这次更新依旧出彩。其实......
2024年5月14日最新GPT-4o 使用方法
2024年5月14日最新GPT-4o使用方法如何访问GPT-4、GPT-4Turbo和GPT-4o？了解如何在ChatGPT中访问GPT-4o，以及通过OpenAIAPI访问GPT-4、GPT-4Turbo和GPT-4o什么是GPT-4o？GPT-4o是OpenAI的新旗舰模型，能够实时处理音频、视觉和文本。GPT-4o将首先在ChatGPT和API中作为文本和视觉......
2024年5月14日最新GPT-4o 使用方法
2024年5月14日最新GPT-4o使用方法如何访问GPT-4、GPT-4Turbo和GPT-4o？了解如何在ChatGPT中访问GPT-4o，以及通过OpenAIAPI访问GPT-4、GPT-4Turbo和GPT-4o什么是GPT-4o？GPT-4o是OpenAI的新旗舰模型，能够实时处理音频、视觉和文本。GPT-4o将首先在ChatGPT和API中作为文本和视觉......
OpenAI 发布全新生成式模型 GPT-4o；字节收购音频设备公司 Oladance丨 RTE 开发者日报 V
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（RealTimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑......
ChatGPT助您打造个性化简历：个人品牌升级攻略
简介在工作过程中，如何做可以拿到更多的面试机会呢？其实这个有一个计算公式，即为：面试的机会=投递的数量（渠道）*命中的比例（简历）。简历对于一个求职者来说：是个人对于公司的第一印象。可以拿到更多面试机会。提高HR的期望，可以拿到更高薪酬。所以在求职投递简历之前，需要尽量保......
跟着ChatGPT学算法-完全背包问题
一、题目给定n个物品，第i个物品的重量为wgt[i-1]、价值为val[i-1]，和一个容量为cap的背包。每个物品可以重复选取，问在限定背包容量下能放入物品的最大价值。二、和ChatGPT聊聊您您是一位资深算法工程师，请深入浅出地给出完全背包问题的分析过程和完整带注释的Java代......
跨境物流网站海外客服系统对接ChatGPT大模型AI自动回复问题
去年的一个客户，主要是做跨境电商的物流运输服务，有自己的物流网站系统。海外客户会在物流系统里咨询很多问题，有不少经常问的问题。这个时候就可以对接AI大模型，上传自己的问答数据到知识库，让AI来自动回复问题。GPT知识库是支持多语种的，可以中英文上传知识库，都能理解并回复上......
MetaGPT 与 ChatDev
MetaGPTMetaGPT是一个基于多智能体的元编程框架，它通过将不同的角色（如产品经理、架构师、项目经理等）分配给不同的大型语言模型（LLM），实现软件开发流程的自动化。这个框架特别适合于复杂的编程任务，能够自动生成用户故事、需求分析、数据结构、API和文档等输出。MetaGPT使用标准......

“她”来了，陪伴赛道巨变！为GPT-4o加上你的一个数字分身

相关文章

赞助商

阅读排行