环球科创网

文生图赛道又出黑马,爆火的Flux真能拳打Midjourney吗?(附对比实测)

更新时间:2024-08-15 09:48:12

导读 AI又一次击穿了现实,这次的主角是文生图赛道的黑马:FLUXFLUX官网:https://blackforestlabs.ai/先来看看最近在X上爆火的两个帖子:乍一看还...

AI又一次击穿了现实,这次的主角是文生图赛道的黑马:FLUX

FLUX官网:https://blackforestlabs.ai/

先来看看最近在X上爆火的两个帖子:

乍一看还以为是什么大会颁奖典礼和TED Talk的现场,但事实上,这些都是FLUX生成的人物图片,用Runway Gen-3、Kling AI、Luma Dream Machine等“图生视频”的产物。

视频中人物的五官、皮肤的质感和光泽感、握着话筒的手、讲话时的手势和口型,不仔细看几乎看不出任何破绽,就连嘉宾证上的Google字样、背景板上的英文字母都清晰可辨。

不少网友把这种“真实”定义为“Flux realism(Flux现实主义)”。

还有专门的FLUX现实主义风格Lora:

https://replicate.com/fofr/flux-dev-realism

当看到AI生成的极为逼真的人物照片手掌上写着“I am not real”,属实被秀到了。

这不是妥妥的户外运动产品的广告代言人吗?

于是有网友感慨:“这下模特们真要失业了。”

还有网友表示:我们正在进入一个不需要跟KOL付费合作的时代,品牌只需要用AI生成与他们的美学相匹配的influencer就行了。

看了这么多惊艳的效果图,这个横空出世的FLUX到底是什么来头?

原来,FLUX背后的AI初创公司黑森林实验室(Black Forest Labs),聚集了一群从Stable Diffusion出走的核心开发成员。这样看来,仅成立一年多就搞出这么大动静也就不足为奇了。

FLUX已经被玩疯了

自8月初发布以来,FLUX可以说是已经被网友们玩出花了。

1. FLUX+图生视频

其中最流行的玩法当然还是用FLUX生图,然后用Runway Gen-3、Kling AI、Luma Dream Machine等AI视频工具转成视频。

举牌求关注视频、自拍视角的Vlog、对镜拍视频、品牌高级感广告大片统统手到擒来。

这光影、这构图,还有模特的妆容和表现力,高级感拉满:

再加上配乐,充满异域风情的服饰、人物脸上热情洋溢的笑容,妥妥的文旅宣传片:

还有网友给视频进行了口型同步,这下AI YouTuber的春天怕不是要来了:

2. FLUX+局部重绘

还有人把FLUX和局部重绘相结合,只见他用笔刷选中怀里的金毛,然后输入提示词“小狮子”,金毛立马摇身一变成了小狮子,而且融合度非常高,手部细节也没有出错。

这小狮子一抱,连带着这个哥们的气质都变了,瞬间有一种迪拜富豪即视感。

感兴趣的玩家可以在HuggingFace上在线体验:

https://huggingface.co/spaces/SkalskiP/FLUX.1-inpaint

3. FLUX+Magnific AI

X网友“Javi Lopez”用AI图像增强软件Magnific对FLUX生成的图片进行了高清和放大处理,照片的真实感瞬间next level。

比如这张王室合照,在经过Magnific优化后,无论是皮肤纹理,还是发丝和光影效果都可谓与真人无异,人物神情也更为细腻。

当然,不止人像,插画、风景、食物、建筑等都可以用Magnific增强。

不过,Magnific AI现在开始收费了,而且还不便宜,每月39美元至299美元不等,不支持退款。

FLUX.1模型拥有12B参数,是目前已知最大的文生图模型,包含3个版本:

“AI新榜”本想下载安装到本地使用,无奈FLUX对电脑显存配置要求太高。

不过,得益于Flux模型的出色表现和开源优势,有很多平台和开发者已经完成了模型的部署,比如Fal.ai、Replicate、TensorArt、Krea.ai都已支持调用Flux模型,无需下载和部署。

另外,在国内的文生图社区和工具平台LibLib AI上,点击左侧边栏的“高级版生图”,也可以在线体验FLUX的Pro和Dev模型。

阿里也推出了FLUX的中文优化版,开发者可以在百炼大模型服务平台体验或调用FLUX模型。

值得一提的是,Black Forest Labs还表示正在开发新的生成式AI视频模型,为视频创作者提供更多的创意可能性。

FLUX vs Midjourney

我们用几组相同的提示词对FLUX和Midjourney进行了对比实测。

总的来说,FLUX基本可以和Midjourney(下文简称MJ)平起平坐了,甚至在一些方面超越了MJ,毕竟Flux开源。

具体而言,在文本内容的精确度、对提示词的理解上,FLUX略强于MJ。但在美学程度和风格多样性(尤其是艺术家风格)上,FLUX比MJ稍逊色些。

放上提示词和对比图,大家可以自行感受一下两者的差别(左Flux 右MJ):

左Flux 右MJ

左Flux 右MJ

左Flux 右MJ

左Flux 右MJ

左Flux 右MJ

上Flux 下MJ

像FLUX这样的模型所生成的逼真图像,确实引发了关于后真相时代(Post-Truth Era)的担忧。

无论如何,Flux.1的发布与开源对于推动文生图技术创新、提升模型质量、增加行业透明度、促进AI技术的普及与应用都意义重大。

正如Black Forest Labs在成立声明中说的那样:“透明度是建立信任和广泛采用的关键”,“我们相信生成式AI将成为所有未来技术的基础构建块。通过向广泛的受众提供我们的模型,我们希望将其好处带给每个人,教育公众,并增强对这些模型安全性的信任”。

免责声明:本文由用户上传,如有侵权请联系删除!