阿里巴巴的图像生成AI「Qwen-Image-Edit-2509」最近引起关注,被认为是谷歌「Nano Banana(Gemini 2.5 Flash Image)」的竞争对手。
这个模型最大的优势是它是开源的,可以在本地电脑上运行。
「Qwen-Image-Edit-2509」是阿里巴巴图像生成AI「Qwen Image」系列之一,相比之前的版本,它可以处理多张图片输入,并且支持ControlNet,功能更加强大。
该模型可以让用户轻松更换特定人物的服装或小饰品,或改变人物的背景和姿势。
它的性能非常强大,可以根据参考图片,生成一致性很高的图像,甚至可以自动创建人物的四面图。
用户也可以在本地环境中使用,只需要一张 NVIDIA RTX 4090 显卡就可以在20-30秒内生成一张图片。
虽然「Qwen-Image-Edit-2509」有一些局限性,比如在生成动漫风格图像时可能会显得平淡,但可以通过添加LoRA(一种额外的学习数据)来改善。
此外,该模型的开源性质意味着用户可以根据自己的需求进行定制和扩展。
总体来说,「Qwen-Image-Edit-2509」是一个非常强大的图像生成AI模型,它的开源性质和使用便利性使其在未来可能会得到广泛的应用,尤其是在企业领域。
 原文链接:https://ribenzhan.com/toutiao/keji/19498/,转载请注明出处。                        
                    
  
                
評論0