更新时间:2024-08-15 09:48:12
AI又一次击穿了现实,这次的主角是文生图赛道的黑马:FLUX
FLUX官网:https://blackforestlabs.ai/
先来看看最近在X上爆火的两个帖子:
乍一看还以为是什么大会颁奖典礼和TED Talk的现场,但事实上,这些都是FLUX生成的人物图片,用Runway Gen-3、Kling AI、Luma Dream Machine等“图生视频”的产物。
视频中人物的五官、皮肤的质感和光泽感、握着话筒的手、讲话时的手势和口型,不仔细看几乎看不出任何破绽,就连嘉宾证上的Google字样、背景板上的英文字母都清晰可辨。
不少网友把这种“真实”定义为“Flux realism(Flux现实主义)”。
还有专门的FLUX现实主义风格Lora:
https://replicate.com/fofr/flux-dev-realism
当看到AI生成的极为逼真的人物照片手掌上写着“I am not real”,属实被秀到了。
这不是妥妥的户外运动产品的广告代言人吗?
于是有网友感慨:“这下模特们真要失业了。”
还有网友表示:我们正在进入一个不需要跟KOL付费合作的时代,品牌只需要用AI生成与他们的美学相匹配的influencer就行了。
看了这么多惊艳的效果图,这个横空出世的FLUX到底是什么来头?
原来,FLUX背后的AI初创公司黑森林实验室(Black Forest Labs),聚集了一群从Stable Diffusion出走的核心开发成员。这样看来,仅成立一年多就搞出这么大动静也就不足为奇了。
FLUX已经被玩疯了自8月初发布以来,FLUX可以说是已经被网友们玩出花了。
1. FLUX+图生视频其中最流行的玩法当然还是用FLUX生图,然后用Runway Gen-3、Kling AI、Luma Dream Machine等AI视频工具转成视频。
举牌求关注视频、自拍视角的Vlog、对镜拍视频、品牌高级感广告大片统统手到擒来。
这光影、这构图,还有模特的妆容和表现力,高级感拉满:
再加上配乐,充满异域风情的服饰、人物脸上热情洋溢的笑容,妥妥的文旅宣传片:
还有网友给视频进行了口型同步,这下AI YouTuber的春天怕不是要来了:
2. FLUX+局部重绘还有人把FLUX和局部重绘相结合,只见他用笔刷选中怀里的金毛,然后输入提示词“小狮子”,金毛立马摇身一变成了小狮子,而且融合度非常高,手部细节也没有出错。
这小狮子一抱,连带着这个哥们的气质都变了,瞬间有一种迪拜富豪即视感。
感兴趣的玩家可以在HuggingFace上在线体验:
https://huggingface.co/spaces/SkalskiP/FLUX.1-inpaint
3. FLUX+Magnific AIX网友“Javi Lopez”用AI图像增强软件Magnific对FLUX生成的图片进行了高清和放大处理,照片的真实感瞬间next level。
比如这张王室合照,在经过Magnific优化后,无论是皮肤纹理,还是发丝和光影效果都可谓与真人无异,人物神情也更为细腻。
当然,不止人像,插画、风景、食物、建筑等都可以用Magnific增强。
不过,Magnific AI现在开始收费了,而且还不便宜,每月39美元至299美元不等,不支持退款。
FLUX.1模型拥有12B参数,是目前已知最大的文生图模型,包含3个版本:
“AI新榜”本想下载安装到本地使用,无奈FLUX对电脑显存配置要求太高。
不过,得益于Flux模型的出色表现和开源优势,有很多平台和开发者已经完成了模型的部署,比如Fal.ai、Replicate、TensorArt、Krea.ai都已支持调用Flux模型,无需下载和部署。
另外,在国内的文生图社区和工具平台LibLib AI上,点击左侧边栏的“高级版生图”,也可以在线体验FLUX的Pro和Dev模型。
阿里也推出了FLUX的中文优化版,开发者可以在百炼大模型服务平台体验或调用FLUX模型。
值得一提的是,Black Forest Labs还表示正在开发新的生成式AI视频模型,为视频创作者提供更多的创意可能性。
FLUX vs Midjourney我们用几组相同的提示词对FLUX和Midjourney进行了对比实测。
总的来说,FLUX基本可以和Midjourney(下文简称MJ)平起平坐了,甚至在一些方面超越了MJ,毕竟Flux开源。
具体而言,在文本内容的精确度、对提示词的理解上,FLUX略强于MJ。但在美学程度和风格多样性(尤其是艺术家风格)上,FLUX比MJ稍逊色些。
放上提示词和对比图,大家可以自行感受一下两者的差别(左Flux 右MJ):
左Flux 右MJ
左Flux 右MJ
左Flux 右MJ
左Flux 右MJ
左Flux 右MJ
上Flux 下MJ
像FLUX这样的模型所生成的逼真图像,确实引发了关于后真相时代(Post-Truth Era)的担忧。
无论如何,Flux.1的发布与开源对于推动文生图技术创新、提升模型质量、增加行业透明度、促进AI技术的普及与应用都意义重大。
正如Black Forest Labs在成立声明中说的那样:“透明度是建立信任和广泛采用的关键”,“我们相信生成式AI将成为所有未来技术的基础构建块。通过向广泛的受众提供我们的模型,我们希望将其好处带给每个人,教育公众,并增强对这些模型安全性的信任”。