Op 1 augustus 2024 heeft Black Forest Labs een baanbrekende aankondiging gedaan: Flux, een revolutionair nieuw text-to-image model, is nu beschikbaar. Dit model vertegenwoordigt de volgende stap in de ontwikkeling van text-to-image technologieën. Ik ben erg onder de indruk van Flux AI! Sinds de lancering ben ik er fulltime mee aan de slag gegaan. In dit artikel leg ik alles uit wat je moet weten van dit nieuwe model.
Zelf gratis mee aan de slag in de browser? Je kan dit model gratis uittesten in de playground. Deze vind je hier: https://replicate.com/black-forest-labs/flux-schnell Je kan hier bij de prompt een tekst invullen. Bij de additional settings (die ingeklapt staan) kun je nog meer dingen instellen, zoals het aantal stappen en de aspect ratio (beeldverhouding) van de afbeelding.
Wat is Flux?
Flux is een geavanceerd text-to-image model ontwikkeld door Black Forest Labs, dat in staat is om tekstuele beschrijvingen om te zetten in realistische afbeeldingen. Het model heeft 12 miljard parameters, wat het de grootste open-source text-to-image model tot nu toe maakt. Flux is ontworpen om zeer gedetailleerde en esthetisch aantrekkelijke beelden te genereren, vergelijkbaar met kunstwerken. Het is beschikbaar in drie varianten: een basismodel (dev) voor de community, een snellere versie (schnell) voor commerciële toepassingen en een professionele versie (pro) met de hoogste kwaliteit en prestaties.
De drie opties van Flux – ai afbeeldingen maken
Black Forest Labs heeft drie varianten van het Flux model aan, elk met unieke kenmerken die aansluiten op verschillende behoeften:
FLUX.1 [dev]
Dit is het basismodel van Flux, open-source en beschikbaar onder een niet-commerciële licentie. Het is bedoeld voor de community om verder op te bouwen en aanpassingen te maken. Dit model is perfect voor onderzoekers en ontwikkelaars die willen experimenteren en bijdragen aan de ontwikkeling van text-to-image technologie.
FLUX.1 [schnell]
De ‘schnell’ variant is een gedistilleerde versie van het basismodel, die tot wel tien keer sneller opereert. Dit model combineert snelheid met uitstekende beeldkwaliteit, en is daarmee geschikt voor commerciële toepassingen. Ik gebruik dit model erg veel met ComfyUI, omdat het (nog) niet beschikbaar is in Automatic1111. Flux Schnell werkt voor mij erg goed op een 3090 videokaart.
FLUX.1 [pro]
De ‘pro’ versie van Flux is een gesloten-source model dat exclusief beschikbaar is via een API. Dit model biedt de hoogste kwaliteit en prestaties, en is ontworpen voor professionele gebruikers die geavanceerde functionaliteiten en ondersteuning nodig hebben. De ‘pro’ versie is ideaal voor bedrijven die op zoek zijn naar de beste text-to-image oplossingen voor hun producten en diensten.
Belangrijkste kenmerken
- Verbeterde beeldkwaliteit: Genereer verbluffende visuele beelden met hogere resoluties.
- Geavanceerde menselijke anatomie en fotorealisme: Bereik zeer realistische en anatomisch nauwkeurige afbeeldingen.
- Verbeterde prompt-adherence: Krijg meer nauwkeurige en relevante afbeeldingen op basis van je invoer.
- Uitzonderlijke snelheid: Profiteer van de snelheid en efficiëntie van Flux Schnell, ideaal voor toepassingen met hoge vraag.
- Erg goed met tekst: Ik heb een aantal testen gedaan met tekst in afbeelding (zie verderop voor mijn testen) en het resultaat is echt verbluffend goed. Zo goed heb ik het nog niet meegemaakt, ook niet bij Leonardo Phoenix.
Voorbeelden
*De uitgelichte afbeelding heb ik ook gemaakt met Flux natuurlijk!
Goed om te weten: Je kan op het moment Flux op meerdere manieren gebruiken. Op de website (zie hieronder in belangrijke links) van Black Forest Labs staan meerdere opties. Ik gebruik het in ComfyUI. Het generen kost soms wel wat tijd (het gaat minder snel dan met Stable Diffusion 1.5 of XL). Ik ga de komende tijd steeds meer toevoegen aan de galerij!
Belangrijke links
Wil je meer weten of er zelf mee aan de slag? Ik heb een aantal links voor je op een rij gezet:
- Black Forest Labs aankondiging in een artikel: https://blackforestlabs.ai/announcing-black-forest-labs/
- GitHub: https://github.com/black-forest-labs/flux
- HuggingFace: Flux Dev: https://huggingface.co/black-forest-labs/FLUX.1-dev
- Huggingface: Flux Schnell: https://huggingface.co/black-forest-labs/FLUX.1-schnell
- Diverse ComfyUI Flux Workflows: https://openart.ai/workflows/all?keyword=Flux
Wat heb ik gemerkt de afgelopen tijd tijdens mijn Flux testen?
Ik heb een lijst bijgehouden:
- Het model is vrij lastig om aan de praat te krijgen voor mensen die niet technisch onderlegd zijn. Gelukkig is het wel te gebruiken in de playground, maar daar zitten wel veel restricties aan qua woordfilters.
- Anime, tekeningen, niet-realistische renders, zijn heel erg goed. Realistische afbeeldingen voelen toch nog erg nep. Ik ben benieuwd als er mensen zijn die LoRA’s gaan trainen in Flux. Al vrees ik wel voor de VRAM die nog gaat zijn.
- Het model is niet erg getraind op NSFW. Dit merk je ook erg in de output. Lijkt op gebied van anime / cartoon wel beter te zijn, maar realistisch wederom niet.
- Dit kan wel eens een van de betere modellen gaan worden voor de komende jaren!
- Prompt adherence is werkelijk fantastisch