您的位置:首页 > 互联网

EasyPhoto:开源本地化部署的妙鸭相机,真的要革了海马体们的命了?|手把手教你搭建妙鸭相机

发布时间:2023-09-19 18:52:55  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】EasyPhoto作为妙鸭相机平替,有着不输妙鸭相机的生成质量,还有更好的定制化空间和本地部署的优势。

年初由ChatGPT引发的AI浪潮奔涌至今,除了OpenAI推出的当红炸子鸡之外,中文互联网内热度最高的产品,非前段时间霸屏的妙鸭相机莫属了。

只要上传20张自己的自拍照,就可以拥有一个专属的数字分身。用户只用挑选自己喜爱的写真模板,就可以得到一张张专业质感的写真。(9块9的体验售价)

最高峰的时候,用户交了钱之后需要等接近10个小时才能获得自己的数字分身和写真。网传一个月流水超过1000万人民币。

但从上边的妙鸭相机搜索趋势图也能看出来,网红产品的宿命,很难逃开火速蹿红+极速陨落。

宏光mini ev车联网

因为用户协议中关于用户数据极为离谱的霸王条款,加上傲慢的不予退款政策,爆火之后的妙鸭相机很快就被负面舆论反噬,热度也迅速下滑。

而如果用户能在本地部署一个妙鸭相机,就能完全不用忍受高峰期长达数个小时的排队取照,也完全不用担心自己的照片和用户数据被开发者滥用。

由国内一个团队推出的EasyPhoto,就瞄准了这个痛点,在Github上开源了一个由Stable Diffusion作为基础,开源且支持本地化部署的妙鸭相机。

同样也是通过5-20张自己照片的训练,本地部署的模型就能通过EasyPhoto推理出堪比妙鸭相机的写真风照片。

而且相比于妙鸭相机,它还支持生成多人的照片。同时,用户还可以自己选择除了SD之外的其他模型来生成写真照片。

对于那些动手能力强的用户,EasyPhoto相当于一个加强版且免费的妙鸭相机。

sony手表电池能用多久

甚至,只要自己有足够的算力资源,这个通用的AI写真生成框架可以直接向其他用户提供和妙鸭相机类似的AIGC服务。

使用指南

模型训练

EasyPhoto训练界面如下:

  • 左边是训练图像,只需点击上传照片即可上传图片,点击清除照片即可删除上传的图片;

  • 右边是训练参数,不能为第一次训练进行调整。

点击上传照片后,用户就可以开始上传图像这里最好上传5到20张图像,包括不同的角度和光照。最好有一些不包括眼镜的图像。如果所有图片都包含眼镜眼镜,则生成的结果可以容易地生成眼镜。

然后点击下面的开始训练,此时,需要填写上面的用户ID,例如用户名,才能开始培训。

模型开始训练后,webui会自动刷新训练日志。如果没有刷新,请单击Refresh Log按钮。

如果要设置参数,每个参数的解析如下:

2.人物生成a.单人模版

  • 步骤1:点击刷新按钮,查询训练后的用户ID对应的模型。

  • 步骤2:选择用户ID。

  • 步骤3:选择需要生成的模板。

  • 步骤4:单击生成按钮生成结果。

b.多人模板

  • 步骤1:转到EasyPhoto的设置页面,设置num_of_Faceid大于1。

  • 步骤2:应用设置。

  • 步骤3:重新启动webui的ui界面。

  • 步骤4:返回EasyPhoto并上传多人模板。

  • 步骤5:选择两个人的用户ID。

  • 步骤6:单击生成按钮。执行图像生成。

算法详细信息

架构概述

在人工智能肖像领域,团队希望模型生成的图像逼真且与用户相似,而传统方法会引入不真实的光照(如人脸融合或roop)。

为了解决这种不真实的问题,团队引入了Stable Diffusion模型的图像到图像功能。

生成完美的个人肖像需要考虑所需的生成场景和用户的数字二重身。

使用一个预先准备好的模板作为所需的生成场景,并使用一个在线训练的人脸 LoRA 模型作为用户的数字二重身,这是一种流行的Stable Diffusion微调模型。

项目团队使用少量用户图像来训练用户的稳定数字二重身,并在推理过程中根据人脸 LoRA 模型和预期生成场景生成个人肖像图像。

训练细节

首先,对输入的用户图像进行人脸检测,确定人脸位置后,按照一定比例截取输入图像。

谷歌与亚马逊

然后,使用显著性检测模型和皮肤美化模型获得干净的人脸训练图像,该图像基本上只包含人脸。

然后,项目团队为每张图像贴上一个固定标签。这里不需要使用标签器,而且效果很好。最后,项目团队对Stable Diffusion模型进行微调,得到用户的数字二重身。

在训练过程中,会利用模板图像进行实时验证,在训练结束后,项目团队会计算验证图像与用户图像之间的人脸ID差距,从而实现Lora融合,确保项目团队的Lora是用户的完美数字二重身。

此外,项目团队将选择验证中与用户最相似的图像作为face_id图像,用于推理。

推理细节a.第一次扩散:

首先,将对接收到的模板图像进行人脸检测,以确定为实现Stable Diffusion而需要涂抹的遮罩。

然后,将使用模板图像与最佳用户图像进行人脸融合。人脸融合完成后,将使用上述遮罩对融合后的人脸图像进行内绘(fusion_image)。

此外,还将通过仿射变换(replace_image)把训练中获得的最佳face_id图像贴到模板图像上。

然后,将对其应用Controlnets,在融合图像中使用带有颜色的canny提取特征,在替换图像中使用openpose提取特征,以确保图像的相似性和稳定性。

然后,将使用Stable Diffusion结合用户的数字分割进行生成。

b.第二次扩散:

在得到第一次扩散的结果后,将把该结果与最佳用户图像进行人脸融合,然后再次使用Stable Diffusion与用户的数字二重身进行生成。第二次生成将使用更高的分辨率。

参考资料:

https://github.com/aigc-apps/sd-webui-EasyPhoto


返回网站首页

本文评论
十大信创领军企业联袂出席 奇安信可信浏览器开辟政企市场新赛道
  4月2日,国内最大的网络安全公司奇安信通过蓝信平台举行了线上发布会,正式发布了奇安信可信浏览器。飞腾公司总经理窦强、麒麟软件副总裁李震宁、东软集团副总裁杨纪文、...
日期:11-14
马斯克登顶福布斯2022年度美国富豪榜:这是美国最富有的20人「世界富豪榜马斯克」
  福布斯9月27日发布美国2022年度福布斯400强榜单,马斯克以2510亿美元的财富取代连续四年“霸榜”的贝索斯,首次位列榜首。比尔·盖茨、拉里·埃里森、沃伦·巴菲、拉里·佩...
日期:10-05
“百模大战”,来了「百人大战模拟器」
声明:本文来自于微信公众号 深燃(ID:shenrancaijing),作者 | 王敏编辑 | 金玙璠,授权转载发布。一夜之间,AI大模型热得发烫。继3月中旬,百度最先下场,以“文心一言”抢占了对标Chat...
日期:04-13
蜜雪冰城又被新兵攻陷了 店内机器忙到冒烟「蜜雪冰城摊上大事了」
9月13日,北京一家蜜雪冰城店突然被一群军训的大学新生“攻陷”,店内一片混乱。据悉,这群新生结束了早上的拉练后,得知下午可以放假,于是兴奋地涌向了蜜雪冰城,准备买冰淇淋和奶茶...
日期:09-13
趣头条“放心看”再升级 刘蓓吴昕王姬马雅舒众星传递健康正能量
  “没有全民健康,就没有全面小康。“随着互联网普及,对公民和医疗服务产业而言,发现和预防问题的需求也在不断扩大,亟待新时期健康服务的新思路,充分发挥各方力量,建设起“预...
日期:01-14
谷歌Android在美国市场尚未超越苹果iOS_和谷歌市场媲美的安卓市场
  1月4日消息,据国外媒体报道,市场研究公司尼尔森当地时间1月3日发表报告称,尽管谷歌Android移动操作系统的增长很快,但在美国尚未超过苹果iOS。   尼尔森引用2010年11月份...
日期:07-25
扎克伯格称人工智能正在提升meta的流量和收入_扎克伯格的智能家居
Facebook母公司meta的首席执行官马克·扎克伯格周三表示,人工智能(ai)正在帮助公司增加流量,并从广告销售中获得更多收入。meta的第二季度收入前景明显高于分析师的预期。人工智...
日期:04-27
浙大区块链教授蔡亮:元宇宙未来面对四大方面挑战「蔡亮 浙大」
凤凰网科技讯 7月4日消息,日前,由长沙市人民政府、中国通信标准化协会联合主办的“Web3.0信任科技大会”在长沙召开。国家区块链创新应用试点行动专家组副召集人蔡亮教授发表...
日期:07-04
泡泡玛特 a股_股价暴跌后,泡泡玛特回应这些争议
查看最新行情   记者/马越   编辑/许悦   上市近2年的泡泡玛特迎来了股价上的“至暗时刻”—— 7月的连续多日下跌后,距离巅峰时期接近1500亿港元...
日期:07-31
外媒评鲍尔默领导下的微软所犯5大失误(鲍尔默为什么离开微软)
(观海)北京时间5月28日消息,据国外媒体报道,美国对冲基金经理大卫·埃因霍温(David Einhorn)周三要求微软首席执行官史蒂夫·鲍尔默(Steve Ballmer)下台,网站IBtimes日前则评点...
日期:07-28
腾讯游戏怎么限制未成年游戏时间限制「腾讯发布寒假未成年人游戏限玩通知 呼吁未成年人合理规划假期」
1月9日 消息:腾讯成长守护平台今日宣布了在寒假暨春节期间未成年人玩游戏的限制通知:1月13日至15日、1月20日至27日、2月3日至5日每天的20时至21时,未成年人可以登录游戏,总共...
日期:01-09
大雨中校长毕业典礼致辞:只念了标题 为了让学生少淋雨「校长毕业典礼致辞2020」
6月22日消息,在一所大学毕业典礼上,天突降大雨。为了让学生们少淋雨,校长付子堂把原本准备的3500字讲稿内容总结成了两个知识点知行合一致良知,德法兼修事上练”,网友纷纷给这位...
日期:06-22
培生集团旗下品牌「培生集团将生成式 AI 嵌入其产品中以增强教学与学习」
5月10日消息:知名教育集团培生宣布,已经采取了一项人工智能战略,并将将该技术嵌入其产品中,以增强教学与学习。位于伦敦的这家教育集团表示,多个项目正在进行中,将在其 Workforce...
日期:05-10
mec算力「Meta算力短缺上演“宫斗” 大模型团队半数出走」
通信世界网消息(CWW)日前,Meta大模型团队人员流失大半问题引发热议。据统计,今年2月发表Llama最初研究论文的14位作者中,已有超半数离开了Meta;2022年5月发布的OPT论文的19位作者...
日期:09-13
ace2 一加8「「2 Pro性价比十足 「2999元_一加Ace」」」
来源:中关村在线小米手表绑定手机的教程oppo和vivo销量下降macbook屏幕retina印度剔除中国企业一加手机的直板机系列中,一加Ace 2 Pro是其中一款备受瞩目的产品。这款手机在3...
日期:09-09
华为马海旭:着眼未来,共筑东数西算数字基础设施_华为马海旭毕业学校
[中国,贵阳,2023年5月26日]2023中国国际大数据产业博览会在贵州省贵阳市召开,在大会的高端对话环节,华为副总裁、ICT产品组合管理与解决方案部总裁马海旭,发表了题为“着眼未来,共...
日期:05-27
乔布斯首富榜_乔布斯获被评为今年美国财富创造者第四名
  北京时间12月21日早间消息,《首席执行官》杂志公布的最新排名显示,苹果CEO史蒂夫·乔布斯(Steve Jobs)2010年是排名第四的“财富创造者”。   2010年,只有Priceline的杰弗...
日期:07-25
GitHub仓库WebAI开源:允许开发者直接在浏览器中运行现代深度学习模型
9月12日 消息:web-ai是一个开源的TypeScript库,使开发者可以直接在浏览器或Node.js中运行现代深度学习模型。它提供了一种无需复杂服务器端基础设施或依赖第三方API的方式,将A...
日期:09-12
磁矩是量子化的吗?《张朝阳的物理课》介绍自旋构成的二维子系统
磁矩是量子化的吗?物理学家是怎么从实验上证明自旋的存在的?怎么从数学上描述自旋构成的二维子系统?5月19日12时,《张朝阳的物理课》第一百四十四期开播,创始人、董事局主席兼首...
日期:05-26
三星智能手表怎么样_三星智能手表怎么样?
随着智能手表的推出,消费者对于它的要求越来越高。三星作为智能手表领域的领先者,其智能手表也备受关注。那么,三星智能手表怎么样呢?下面将从外观、功能、性能等方面对其进行介...
日期:05-31