Flux Pro یک مدل پیشرفته تولید تصویر از متن است که توسط Black Forest Labs، تیم اصلی پشت Stable Diffusion، توسعه یافته است. این مدل با ۱۲ میلیارد پارامتر طراحی شده و تصاویر با کیفیت بالا و واقعگرایانهای تولید میکند که از نظر زیباییشناسی شبیه به Midjourney هستند.
ویژگیهای کلیدی Flux Pro
- معماری هیبریدی: این مدل از بلوکهای دیفیوژن چندوجهی و موازی استفاده میکند که به آن امکان میدهد تصاویر با کیفیت بالا و پاسخ سریع به نیازهای پروژههای خلاقانه تولید کند.
- نسبتها و وضوحهای متنوع: Flux Pro از نسبتها و وضوحهای مختلف تا ۲.۰ مگاپیکسل پشتیبانی میکند.
- پیروی قوی از دستورات: این مدل توانایی بالایی در پیروی از دستورات متنی دارد و میتواند عناصر خاصی مانند دستها، پاها و سبکهای خاص را به دقت به تصویر بکشد.
نسخههای مختلف Flux Pro
- FLUX.1 [dev]: مدل پایه با ۱۲ میلیارد پارامتر که به صورت منبع باز و با مجوز غیرتجاری ارائه میشود.
- FLUX.1 [schnell]: نسخه خلاصه شده مدل پایه که تا ۱۰ برابر سریعتر عمل میکند و با مجوز Apache 2.0 ارائه میشود.
- FLUX.1 [pro]: نسخه منبع بسته که فقط از طریق API در دسترس است و برای کاربردهای تجاری طراحی شده است.
عملکرد و آینده
بررسیهای اولیه نشان میدهند که Flux Pro تصاویر با کیفیت بالا و زیباییشناسانهای تولید میکند که به خوبی دستورات متنی را دنبال میکنند. این مدل میتواند روی GPUهایی با 12GB VRAM با تنظیمات دقت پایین اجرا شود. Black Forest Labs همچنین برنامههایی برای توسعه مدلهای تولید ویدئو از متن در آینده دارد.