Stable Diffusion

Stable Diffusion ist ein ziemlich cooler Deep-Learning-Text-zu-Bild-Zauberer. Diese Open-Source-Software wird vor allem genutzt, um aus Textbeschreibungen beeindruckende Bilder entstehen zu lassen. Aber das ist noch nicht alles! Du kannst sie auch für coole Sachen wie Inpainting, Outpainting und Bild-zu-Bild-Übersetzungen mit Text-Prompts nutzen.

Die Technik dahinter ist ein sogenanntes latentes Diffusionsmodell, eine Art tiefes generatives neuronales Netz. Das Ganze wurde von den schlauen Köpfen der CompVis-Gruppe an der LMU München zusammen mit Stability AI, CompVis LMU und Runway entwickelt – und das sogar mit Unterstützung von EleutherAI und LAION.

Im Oktober 2022 haben sich die Jungs und Mädels von Stability AI ordentlich die Taschen vollgemacht: In einer Finanzierungsrunde, angeführt von Lightspeed Venture Partners und Coatue Management, haben sie satte 101 Millionen US-Dollar eingesackt.

Aber das Beste kommt noch: Der Code und die Modellgewichte von Stable Diffusion sind für alle verfügbar und lassen sich auf den meisten Consumer-Hardware-Systemen mit einer durchschnittlichen GPU mit mindestens 8 GB Grafikspeicher zocken. Das ist echt ein Gamechanger im Vergleich zu anderen txt2img-Modellen wie DALL-E und Midjourney, die nur über Cloud-Dienste verfügbar sind.

Das könnte Dich auch interessieren:

Abonniere unseren Newsletter 🥳