首页 > 其他分享 >“她”来了,陪伴赛道巨变!为GPT-4o加上你的一个数字分身

“她”来了,陪伴赛道巨变!为GPT-4o加上你的一个数字分身

时间:2024-05-16 16:53:28浏览次数:22  
标签:赛道 视频 插件 EasyPhoto 数字 4o 点击 GPT 分身

OpenAI的每次发布,感觉都会干翻一个行业。昨晚GPT-4o的发布,情感陪伴这个赛道像是又要掀起一番惊天巨变。各位创业老板们摩拳擦掌,无数创意精英又要踏入新的征程。

开源社区一定也异常兴奋,相信Huggingface和Github马上又会孕育出新宠,大家都期待做出AI时代的Super App,至少也要是一个Killer App,正如去年暑假大红大紫的妙鸭相机和当下的Kimi Chat。而Remini刚刚推出的黏土风格和jada风格的滤镜,又掀起了图片创作的小高潮。

彼时,10块钱的妙鸭相机横空出世,9块9就能制作出自己的数字分身,平均排队时间竟然超过了5个小时。而短短4个月之后,开源文生图平台Stable Diffusion WebUI上就已经支持类似的功能,甚至还支持了简单的文生视频和换装,在4090上轻松实现了设计自由。一些算力平台迅速跟进,例如AutoDL和Lanrui上,都可以找到现成的镜像,一键启动。笔者近期就在京东云新发布的智算平台上,尝试了这个名为EasyPhoto的SD插件,之所以选择京东云平台,无它,唯价低耳!(顺便说一嘴,加它们微信小助手,可以领取2小时的优惠券)。

恰好昨晚OpenAI发布会,就当作蹭蹭热度,为GPT-4o加一个数字分身。

先上图,我试了三个功能,包括数字分身(类似秒鸭相机生成海马体照片),多人换脸,以及文生视频,效果都相当不错。

这是数字分身效果

 

这是多人换脸的效果:

 

这是生成视频的效果:

 

下面介绍下怎么一步一步使用sd-webui-EasyPhoto来完成上面的创作的。

插件的代码路径为:
https://github.com/aigc-apps/sd-webui-EasyPhoto

为了省钱,我选择了使用京东云的智算平台进行安装,因为已经默认安装了Stable Diffusion WebUI,所以只需要安装插件就行。这个平台的使用和其他家类似,注意启动实例时,记着要选择Stable Diffusion应用,待实例运行后,在操作栏-应用,点击Stable Diffusion就能打开Stable Diffusion的页面。

在Extensions选项卡中,点击Install from URL,输入插件的代码路径,点击Install,稍等几分钟,这个插件就安装好了。

 

安装完成后,就能在页面看到EasyPhoto的标签栏了。需要在Setting标签页中将ControlNet unit number设置为4,点击Apply settings,最后Reload UI。

 

在EasyPhoto标签栏下,找到第一个Train标签,根据提示,上传5~20张你自己的半身照片,点击Start Training开始训练,会提示你输入一个userid,然后就开始训练了,训练过程大概会持续25分钟左右。

 

右边的参数不用调整,直接使用默认的就行。训练完的模型,会保存
/data/apps/stable-diffusion-webui/outputs/easyphoto-user-id-infos目录下,有兴趣的同学可以从JupyterLab的终端,或者使用SSH登陆进行查看。

 

数字分身训练完成后,就可以使用模型进行各种好玩的创作了。例如第二个标签就是照片换脸(Phote Inference),可以选择平台自带的模版,也可以自行上传一个明星照片进行换脸,在下方选择刚刚生成的你的数字分身ID,点击右侧的Start Generation,等待大概5分钟,就能生成一张你的明星照片了。如果你训练了多个数字分身模型,也可以选择多脸替换,这样可以创作出一些搞笑的CP照。

 

在右侧的Video Inference窗口,可以进行视频生成创作。虽说生成的效果和Sora还是有很大差距,但对很多场景,已经够用了。操作很简单,先选择一个视频场景,然后选择你的数字分身UserID,点击Start Generation按钮就开始生成了。

 

我们可以试着调整下Prompt,以获得更好的场景描述,可以点击左下角的高级选项,调整下视频的格式和长度,默认为gif格式,可以改为MP4格式,设置Video Max num of frames为视频的长度(秒数)* Video Max fps,这样就可以生产长视频了。

 

这就是最简单的EasyPhoto的入门教程了,大家可以亲自上手实践下,探索更多有趣的玩法,反正有2个小时代金券可以白P

标签:赛道,视频,插件,EasyPhoto,数字,4o,点击,GPT,分身
From: https://www.cnblogs.com/Jcloud/p/18196240

相关文章

  • GPT-4o
    跳至主要内容 研究产品安全公司   2024年5月13日你好GPT-4o我们宣布推出GPT-4o,这是我们的新旗舰模型,可以实时对音频、视觉和文本进行推理。贡献 尝试ChatGPT (在新窗口中打开)在游乐场尝试 (在新窗口中打开)重新观看现场演......
  • How to subscribe to GPT4?
    如何在没有海外银行卡、海外手机号的情况下注册GPT4?概述:注册美区AppleID,使用礼品卡充值。免责声明:这个过程在理论上是被Apple禁止的,仅能够保证的是截止2024.5这套方法还在生效。由于账号被封导致的问题概不负责。材料:一台Apple设备。一个没有注册过AppleID(或者只注......
  • OpenAI最新模型GPT4o十个牛逼的应用场景!
    OpenAI真是要压着谷歌打么?哈哈!直接赶在谷歌之前开了一个新品发布会。   今天凌晨直播,早上一起来就发现已经可以体验新模型了。    从录播内容来看,并没有传言的GPT5,也没有所谓的搜索功能。但是,这次更新依旧出彩。其实......
  • 2024年5月14日最新GPT-4o 使用方法
    2024年5月14日最新GPT-4o使用方法如何访问GPT-4、GPT-4Turbo和GPT-4o?了解如何在ChatGPT中访问GPT-4o,以及通过OpenAIAPI访问GPT-4、GPT-4Turbo和GPT-4o什么是GPT-4o?GPT-4o是OpenAI的新旗舰模型,能够实时处理音频、视觉和文本。GPT-4o将首先在ChatGPT和API中作为文本和视觉......
  • 2024年5月14日最新GPT-4o 使用方法
    2024年5月14日最新GPT-4o使用方法如何访问GPT-4、GPT-4Turbo和GPT-4o?了解如何在ChatGPT中访问GPT-4o,以及通过OpenAIAPI访问GPT-4、GPT-4Turbo和GPT-4o什么是GPT-4o?GPT-4o是OpenAI的新旗舰模型,能够实时处理音频、视觉和文本。GPT-4o将首先在ChatGPT和API中作为文本和视觉......
  • OpenAI 发布全新生成式模型 GPT-4o;字节收购音频设备公司 Oladance丨 RTE 开发者日报 V
      开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑......
  • ChatGPT助您打造个性化简历:个人品牌升级攻略
    简介在工作过程中,如何做可以拿到更多的面试机会呢?其实这个有一个计算公式,即为:面试的机会=投递的数量(渠道)*命中的比例(简历)。简历对于一个求职者来说:是个人对于公司的第一印象。可以拿到更多面试机会。提高HR的期望,可以拿到更高薪酬。所以在求职投递简历之前,需要尽量保......
  • 跟着ChatGPT学算法-完全背包问题
    一、题目给定n个物品,第i个物品的重量为wgt[i-1]、价值为val[i-1],和一个容量为cap的背包。每个物品可以重复选取,问在限定背包容量下能放入物品的最大价值。 二、和ChatGPT聊聊您您是一位资深算法工程师,请深入浅出地给出完全背包问题的分析过程和完整带注释的Java代......
  • 跨境物流网站海外客服系统对接ChatGPT大模型AI自动回复问题
    去年的一个客户,主要是做跨境电商的物流运输服务,有自己的物流网站系统。海外客户会在物流系统里咨询很多问题,有不少经常问的问题。这个时候就可以对接AI大模型,上传自己的问答数据到知识库,让AI来自动回复问题。GPT知识库是支持多语种的,可以中英文上传知识库,都能理解并回复 上......
  • MetaGPT 与 ChatDev
    MetaGPTMetaGPT是一个基于多智能体的元编程框架,它通过将不同的角色(如产品经理、架构师、项目经理等)分配给不同的大型语言模型(LLM),实现软件开发流程的自动化。这个框架特别适合于复杂的编程任务,能够自动生成用户故事、需求分析、数据结构、API和文档等输出。MetaGPT使用标准......