Co je Stable Diffusion?
Stable Diffusion je open-source model umělé inteligence, který vytváří obrázky z textového popisu. Patří mezi difuzní modely: začne s náhodným šumem a krok za krokem ho odstraňuje, dokud se neobjeví obrázek odpovídající vašemu zadání. Od nástrojů jako Midjourney nebo DALL-E se liší tím, že jeho váhy jsou veřejné. Model si můžete stáhnout, spustit na vlastním hardwaru a upravit, místo abyste volali cizí API.
Lidsky řečeno
Většina generátorů obrázků je jako kuchyně v restauraci, do které nevidíte: objednáte si a přijde hotový talíř. Stable Diffusion vám dá recept i sporák. Stejné jídlo si uvaříte doma, vyměníte suroviny a doladíte ho, jak chcete. O tu svobodu právě jde, ale je za ni potřeba kuchyni obsluhovat sami.
Proč na tom záleží
- Běží u vás. Vaše zadání ani obrázky neopustí váš počítač, což je důležité u citlivé nebo nezveřejněné práce.
- Můžete ho doučit. Na pár příkladech ho naučíte konkrétní produkt, postavu nebo výtvarný styl, což uzavřená API málokdy umožní.
- Je zdarma. Když máte hardware, neplatíte za jednotlivé obrázky, takže i hromadné generování zůstává levné.
- Má velký ekosystém. Staví na něm nástroje jako ComfyUI a Automatic1111 a tisíce komunitních modelů na Hugging Face a Civitai.
Na co si dát pozor
- Potřebuje pořádnou grafiku. Slušná grafická karta je praktické minimum. Na procesoru v notebooku může jeden obrázek trvat i minuty.
- Kvalita se model od modelu hodně liší. Základní model je jen výchozí bod. Většina dobrých výsledků vzniká z komunitních doučených verzí a vybrat tu správnou chce trochu zkoušení.
- Rozběhání není pro začátečníky. Spustit ho u sebe znamená nainstalovat nástroje a spravovat soubory s modely. Pokud chcete jen rychle obrázky, hostovaná služba dá méně práce.
- Licence a pravidla obsahu pořád platí. Veřejné váhy neznamenají, že je dovoleno všechno. Před zveřejněním si ověřte licenci modelu i práva k tomu, co vygenerujete.
Související články
- Co je to difuzní model? - Technika odstraňování šumu, na které Stable Diffusion stojí.
- Co je generativní AI? - Širší rodina modelů, které tvoří text, obrázky i další obsah.
- Co je to prompt? - Pokyn, který zadáte umělé inteligenci, a proč jeho formulace mění výsledek.
Chcete být o krok napřed?
Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.
