驯服调皮的 Diffusion,就能让服装卖家们不再为请模特发愁了! - 行业资讯 -

当前位置:首页  >  行业资讯  > 正文

驯服调皮的 Diffusion,就能让服装卖家们不再为请模特发愁了!

驯服调皮的 Diffusion,就能让服装卖家们不再为请模特发愁了!
2023-07-12 09:27:41 来源:ZAKER科技

产品简介:简单来说 ,Weshop 就是 " 一键给服装商品配个模特 " 的 AI 工具。用户在上传自己拍摄的真实服装图片后,可以在它提供的交互界面里,通过简单的勾选和语言描述,生成不同风格种类的模特图。这对中小电商卖家,尤其一些需要外籍模特的跨境商家来说,可以节省很多成本。目前它已经对外开放,并可以免费试用。


(资料图片仅供参考)

2022 年 8 月,Stable Diffusion 开源了它的模型。它进一步降低了对计算设备的需求,同时又带来了惊艳的图片生成效果,和已经被很多人把玩的 Midjourney 一起,伴随着口水和争执彻底带火了 AI 生成图片的技术应用。但随着使用者增加,人们也困扰于它的不可控:一些细节总是无法按照需要生成,导致图片经常无法真正的被使用——虽然叫 stable 但并不怎么稳定。

直到次年 2 月,ControlNet 的出现改变了一切。这是一种神经网络结构,通过增加更多的条件来控制扩散模型,当加到 Stable Diffusion 上后彻底改变了它的可用性。

在 Controlnet Stable Diffusion 刚一出现时,并没有立刻改变混乱的 AI 绘画社区,艺术家和创作者们还是在混乱而兴奋的讨论和使用着这些工具,但在杭州的一个小办公室里,一个一直在关注 Diffusion 模型的小团队,觉得他们等了很久的东西终于出现了。

" 我觉得这一波有机会了。" 吴海波对我说。他是 WeShop 团队的负责人,他们开发了一款基于 Diffusion 模型的服装模特生成工具。WeShop 团队是电商公司蘑菇街的一支特种兵,他们一直在关注虚拟试衣的方向,在 Stable Diffusion 出来时,他们已经在尝试搭建自己的各种 demo,而看到 ControlNet 的一刻,他们觉得是时候做一些更深入的版本了。

ControlNet 让一个期待了许久的技术走向商业场景的可用,而另一个冲击也在 4 月到来—— Meta 的 Segment Anything 出现。这是一个用于图形分割的基础模型,让人们可以只通过提示工程就可以高效的完成高质量的图形分割。

这是一次飞跃,所有人都炸了。

吴海波回忆他所在的技术讨论小群看到这篇论文的那个夜晚。" 那天晚上大家都很热闹,因为你一直在做相关的工作,就会发现你看到这个技术时你的理解跟别人不一样,你一直苦恼的东西你觉得它能马上解决。"

然后一周半不到,WeShop 的全新方案完成。

今天你打开 WeShop 的网站,可以看到这是一个三列式的布局。" 最左边是功能图,你可以理解成它是我今天雇的一个 AI 摄影师,他目前主要是干这个场景的,但我们未来会有非常多场景,比如说你要拍个淘宝类的,拍个小红书类的,拍个拼多多类的,你再拍个亚马逊类的,以前只能一套图多用,但现在完全是可以的。 "

简单来说 ,WeShop 就是 " 一键给服装商品配个模特 " 的 AI 工具。用户在上传自己拍摄的真实服装图片后,可以在它提供的交互界面里,通过简单的勾选和语言描述,生成不同风格种类的模特图,也可以选择让这些模特出现在不同的背景中。这对中小电商卖家,尤其一些需要外籍模特的跨境商家来说,可以节省很多成本。目前它已经对外开放,并可以免费试用。

以下为一些真实例子,可以看到,它生成的图片和真实模特拍摄的之间已经难以区分。

" 商家们比我们更聪明 "

技术方案确定的同时,WeShop 也快速选择了两个主要的商用场景:一个是外模场景,另一个是 " 真人场景 "。

前者来自于 WeShop 过去几年和跨境商家的接触,他们普遍苦于寻找合适的外籍模特,而疫情更加深了这种苦恼;另一个则基于蘑菇街的电商经验。

" 因为我们做这么多年电商之后,非常讨厌货不对版,我们认为必须设定底线,也就是但凡任何一套技术它会改变商品本身的细节的,售卖的过程中就会出问题,就不能上。"

所以 WeShop 设计了真人和人台的概念。

" 人台是说,你针对真实产品虽然请不起外模,但你自己把它穿上去,你只要这样拍,具体是什么样都无所谓,你在哪里拍都好,我们都可以给你生成好看的模特图片。我们产品反复在迭代就是降低你对图片本身的要求,这是核心未来要不停做的。" 吴海波说。

" 第二个是真人,也就是有好多国内卖家,他其实也拍过图了,拍过图之后我们可以帮他把图换掉,可以生成另一种图。"

而在产品逐渐提供给商家试用后,更多的有意思的需求由商家们提了出来。

一个是今天网红带货里非常爱说的 " 氛围感 ",有非常多的商家反馈他们非常需要抠背景,就是商品换背景,换各种地方,而传统的技术会显得不够逼真。" 然后我们发现我们花了一点精力做了一下,效果也很好,我们也就做上去了。"

而更让开发团队感到惊喜的,是聪明的商家们发明的使用窍门。

在人台的生成过程中,不可避免出现一些崩掉的问题。weshop 团队一开始想了各种方法,比如让商家自己买个真人台,要求一定要有头,或者用技术的方法给每一个人台再生成一个头。

最后发现,用户自己解决了,方法非常简单,就是在上传图片时,同时在头的位置涂抹两下,就好了。

" 是我们自己想多了,用户比我们聪明多了。" 他说。而这样的做法从技术上也能立刻理解,它帮助模型识别的更准确。" 我们马上会有一个新的功能,就是让他更容易涂,直接在我这边能涂,不用去美图秀秀,也不用去 ps 中涂,后面还会再加一个小工具扩一下,可以涂,还可以把四肢长出来。"

越来越多的商家开始使用,也有越来越多的商家开始付费。目前,weshop 的订阅价格为 298 元 / 月、598 元 / 月、1598 元 / 月,其对应算力点为 20000、60000、200000,分别约可生成 2000 张、6000 张、20000 张商拍图。此外 WeShop 也提供 " 加油包 " 作为算力补充,有 25 元、125 元、250 元三个档位可供选择。在这个收费逻辑下,用户使用 WeShop 越熟练,算力浪费就越少,即单张商拍图的价格就越低。

产品经理思路

作为一款基于新流行的人工智能技术开发的产品,也意味着它在开发过程中要面对全新的问题,以及解决全新问题的技术路线的抉择与取舍。

在技术方案确定后,WeShop 团队面对的最大挑战依旧是如何让这套技术方案能够在业务工作流里听他们的话。让扩散模型可以被掌控永远是非常难的事情。

如果把 Diffusion 想成一个人,他就是一个很调皮,有自己想法的人。

比如,吴海波介绍了一个调皮的例子:" 大部分时候我们把图像切割出来之后,Diffusion 模型非常喜欢在商品的边缘做一些他自己的修饰,比如说他给你袖子这里加一个链条,或者说你明明是一个穿着高跟鞋的,他给你上面加一些花纹,就是你的鞋面上给你加一点东西,你的鞋跟给你加一点东西,就这些事情他非常喜欢干。"

而面对这样的问题,WeShop 团队也曾想出很算法科学家的解决方案——他们开发了一个模型。" 这个当时按我们的理解,就是一个局部重绘的场景,所以我们当时就开发一个模型,它可以缓解很多这种问题。" 吴海波说。

但是当模型上线时,在测试的时候他们发现,这个模型会让整体照片的质感偏向一种油画的感觉,像是加了一层滤镜——这是产品经理思路的人才会发现的问题。

" 对产品经理来讲,才会盯这个东西,且盯得很细。我们在自己的测试集里面是没有问题的,如果是发 paper 的那种算法开发的思路,这就够了。但是我们选择拿很多用户上次跑过的案例再跑一次,结果两张图放一起比就发现,一些情况下滤镜的感觉就出来了。" 吴海波说。

团队内部为此争论了一个星期。" 这是一个电商场景,他拿回去还要再做处理的,我最好给他的是一个 iPhone 原片,或者是某个单反摄像机的原片这种感觉,他可以再做处理。但我如果已经给他了,他就没法用了,它的感受不一样,感受 p 图过度了。"

" 最后我们决定下线自己研发的这个模型。" 吴海波说。" 对我们来说迭代出一个模型是非常困难的,而且好不容易有一个模型能上线解决一个很重要的问题,但最终我们还是强行下线了它,没有让它出现在客户面前过。"

这也形成了 WeShop 的产品思路,产品经理的比重会大过纯算法或者技术的思路,因为后者往往会走向炫技的陷阱。

WeShop 团队内部也经常讨论为什么 GPT 会在 OpenAI 而不是在 Google 出来的问题。一个结论就是,对同样的模型,怎么去调它这件事,理解是不一样的。

" 我们实践的过程中我们出的图脸很少崩的,因为我们接受不了脸崩这件事情,因为我做产品的,我怎么把整个脸都崩成鬼畜的样子出来,这是不能接受的。但是如果是一个工程师团队或者是一个学术团队,我第一波做完,我现在公开测试指标好不好,我指标如果不错,然后再从我的 case 中,只要我的脸崩概率小于百分之多少,我就认为可用了,就类似于这一套东西跟我们以前做算法很像的,发 paper 的思路,做完结束了,那就做下一个。

吴海波记得 OpenAI 也分享过类似的经验,他们与 Google 的区别就在于,OpenAI 的人们就像一个产品团队,开发后会不停的用产品,而 Google 的团队在学术界 paper 发完了就进入到下一个课题了。

" 但是只有产品经理、对产品负责的人,他才会反复对自己孩子一样,反复用它,你才会知道它的边界已经超出你的认知了,你指导回来的那个技术方向也就不一样。"

吴海波认为,他们今天能做到这个程度,一定程度上也是对 SD 的实践是远多于其他人。

" 它的边界在哪里?我们试过的 case 是多于其他人的,所以当我们产品第一天上线的时候,可能别人还不太理解为什么能到这种效果。其实每次历史上都是有一波人他自己因为用的够多了,才会对这个东西有更好的理解,然后做的东西就不太一样。"

在 6 月中旬,谷歌也发布了用在虚拟试衣的 TryOn Diffusion,可以向顾客展示衣服在不同体型和尺寸的真实模特身上的效果。它基于扩散的框架,把两个 Parallel-Unet 统一起来,实现了对衣服细节的更好的把控。

达到这个效果的一个重要方法,是基于谷歌自身算力资源进行的大量训练。

" 我们也看了它的研究,其实证明了这条路的前景,大厂用暴力证明这条路,后面开源社区会给它进一步实现。" 吴海波说。

虚拟试衣看起来离我们越来越近。

不过,在这样一个蓬勃发展的技术下,单独的一个产品不是最终的目的。WeShop 团队经常思考,什么才算是 AI native 的产品。

" 当然今天这个产品刚做出来还比较早期,但我们内部有一些想法,他们不一定对,但是更远。" 吴海波说。他相信 AI Agents 的方向,未来会是很多种 AI 工具最终结合到一起,有点像是一个 AI 管理的经理。

" 今天的大模型有点像一个常青藤毕业读了最多的书,有非常好的背景的学生,他什么都懂,什么都能跟你聊一聊,但他就是不知道你的业务问题是什么。" 他说。

"AI 的技术虽然很强,但它总是要有某个流程把它串在一起。怎么串可能现在还不知道,但我们先把一些特定的场景做出来,可能谁第一个找到这个业务流程中数据闭环或者业务闭环,找到能跟 AI 之间反馈并且直接迭代的,谁就有了最深的壁垒。"

标签:

(责任编辑:news01)
沙湖相连 阿尔金山的沙漠生态宛如画卷

沙湖相连 阿尔金山的沙漠生态宛如画卷

近日,总台记者在阿尔金山国家级自然保护区,海拔4000米左右的东昆仑支
07-09 19:56:50
荣耀Magic V2未发先火!官方预约人数已超6万

荣耀Magic V2未发先火!官方预约人数已超6万

快科技7月9日消息,今天,截至本文成稿,荣耀MagicV2的京东自营店预约
07-09 18:27:51
镇政府人员回应吉林私搭浮桥案:村民需求强烈,未见强制收费

镇政府人员回应吉林私搭浮桥案:村民需求强烈,未见强制收费

近日,吉林白城洮南市瓦房镇村民黄德义因私自搭桥收费而被判刑一事,引
07-09 17:24:01
吓人!一男子高空休克!医生紧急提醒

吓人!一男子高空休克!医生紧急提醒

闷热的夏天蚊虫也开始“燥”起来了7月7日福州一名高空作业的男子就不慎
07-09 15:55:19
进展 | 国资委:国企数字化转型工作进展

进展 | 国资委:国企数字化转型工作进展

进展|国资委:国企数字化转型工作进展,国企,央企,国资委,智能化,国有企
07-09 14:50:55
离子交换树脂再生剂(软水盐)商品报价动态(2023-07-09)

离子交换树脂再生剂(软水盐)商品报价动态(2023-07-09)

交易商品牌 产地交货地最新报价离子交换树脂再生剂(软水盐) 含量99
07-09 14:03:41
TES比赛不消音真不行,网友放出现场实拍,JKL一出场就被喊出列

TES比赛不消音真不行,网友放出现场实拍,JKL一出场就被喊出列

除了比赛的激烈之外,大家也发现这赛季的节奏比上赛季多了很多,有两件
07-09 12:29:07
应急管理部派出工作组赶赴湖北宜昌五峰县山体滑坡救援现场

应急管理部派出工作组赶赴湖北宜昌五峰县山体滑坡救援现场

应急管理部已启动地质灾害四级应急响应,派出工作组赶赴现场指导当地做
07-09 11:12:14
中国人在越南造出个“薇娅”?

中国人在越南造出个“薇娅”?

有这么一群人,在国内创业失败,结果跑到越南暴富了。是不是非常好奇,
07-09 10:24:31
视频|这里是充满希望的沃土

视频|这里是充满希望的沃土

(新甘肃·每日甘肃网记者郝婉君李静付诗冉张永刚实习生郝黄梦婕)责任
07-09 09:45:02
今年上半年全国铁路完成固定资产投资3049亿元

今年上半年全国铁路完成固定资产投资3049亿元

今年上半年,全国铁路固定资产投资呈持续增长态势。重点项目建设取得新
07-09 07:17:30
环卫工人有了24小时“加油站“

环卫工人有了24小时“加油站“

全媒体记者王兰兰报道“参加公益活动前,我们的7座加油站已经全部向环
07-09 05:49:05
甲烷和溴的四氯化碳溶液反应吗(高中化学与溴的四氯化碳反应有哪些分别有什么现象 与四氯化碳呢)

甲烷和溴的四氯化碳溶液反应吗(高中化学与溴的四氯化碳反应有哪些分别有什么现象 与四氯化碳呢)

首先,四氯化碳是很稳定的有机物,基本不会反应。反应的只会是卤素,即
07-08 23:13:02
吉林市博达中学招生电话(吉林市博达中学)

吉林市博达中学招生电话(吉林市博达中学)

1、吉林市的高中有:吉林市第一高级中学校:始建于1907年(清·光绪33
07-08 21:35:42
真无人!无驾驶人智能网联汽车浦东金桥上路,技术不输“老司机”

真无人!无驾驶人智能网联汽车浦东金桥上路,技术不输“老司机”

走在路上,身旁驶过一辆车里面竟然空无一人?没错,无人车上路了。2023
07-08 19:43:39
解酒汤怎么做?

解酒汤怎么做?

解酒汤的做法1、准备2个西红柿,在上面打花刀,加上热水浸泡5分钟,时
07-08 18:41:45
这就是,江苏!

这就是,江苏!

准确,又不完全准确。我们从地图上可以看到。大概率都位于长江以北的江
07-08 16:20:37
西媒:在罗克争夺战中,巴萨胜过了拜仁枪手利物浦等5家豪门

西媒:在罗克争夺战中,巴萨胜过了拜仁枪手利物浦等5家豪门

直播吧7月8日讯西媒Relevo消息,在罗克争夺战中,巴萨胜过了阿森纳、切
07-08 15:44:31
泽连斯基将与他见面,俄方:“高度关注”

泽连斯基将与他见面,俄方:“高度关注”

[新闻页-台海网]据法新社报道,乌克兰总统弗拉基米尔·泽连斯基7日将与
07-08 14:35:27
暴雨!湖北启动洪水防御应急响应

暴雨!湖北启动洪水防御应急响应

暴雨来袭预警连发应急响应启动!昨夜今晨湖北多地连发暴雨、雷电预警今
07-08 13:04:21
长春市工商局网站官网_长春市工商行政管理局官网

长春市工商局网站官网_长春市工商行政管理局官网

1、长春市工商行政管理位于西安大路与昌平街交汇处,其主要职责是:(一
07-08 12:03:36
证监会:支持基金公司拓宽收入来源 允许个人养老金份额设定更低管理费率

证监会:支持基金公司拓宽收入来源 允许个人养老金份额设定更低管理费率

为了配合公募基金费率改革,证监会推出了一系列配套措施,包括大力引入
07-08 11:38:18
12代i5和12代i7笔记本(12代i5和12代i7性价比)

12代i5和12代i7笔记本(12代i5和12代i7性价比)

12代i5和12代i7使用CinebenchR23的跑分测试对比:i5-12500H,只要是游
07-08 08:54:45
去年我国新接造船订单中绿色船舶占比近五成 创历史最高水平

去年我国新接造船订单中绿色船舶占比近五成 创历史最高水平

造船业是现代工业的集大成者,彰显着一个国家的综合工业实力。我国是世
07-08 07:57:44
对标ChatGPT!国产大模型启动 参数数量达到2000亿

对标ChatGPT!国产大模型启动 参数数量达到2000亿

中国工程院院士、鹏城实验室主任高文在7月6日的WAIC2023昇腾人工智能产
07-08 06:51:20
黄金自助“售货机”现身2023年湾区珠宝文化博览会,创意新品引领湾区珠宝产业升级

黄金自助“售货机”现身2023年湾区珠宝文化博览会,创意新品引领湾区珠宝产业升级

一台酷似商场无人售货机的机器橱窗内,展示着闪闪发光的各种黄金产品,
07-08 04:56:58
美国至6月30日当周EIA天然气库存增加720亿立方英尺

美国至6月30日当周EIA天然气库存增加720亿立方英尺

美国至6月30日当周EIA天然气库存增加720亿立方英尺,预期640亿立方英尺
07-07 23:22:42
马蜂窝、保卫萝卜4等31款侵害用户权益APP被工信部通报

马蜂窝、保卫萝卜4等31款侵害用户权益APP被工信部通报

关于侵害用户权益行为的APP(SDK)通报(2023年第4批,总第30批)工业
07-07 21:58:14
聚焦绿色低碳高质量发展 打造船舶建造“中国名片”

聚焦绿色低碳高质量发展 打造船舶建造“中国名片”

央视网消息:首先关注我们的系列报道《建设现代化产业体系》,今天,我
07-07 21:12:38
视频|拒绝“歪七扭八”争做“正直”少年

视频|拒绝“歪七扭八”争做“正直”少年

03:24暑假来临,初中生小红和小敏一起游泳时,小红发现小敏的双肩一边
07-07 20:50:24

为您推荐

精彩推送