Verwendete(s) Programm(e): ComfyUI
Natürlich kam ich an dem Thema KI auch nicht vorbei. Beruflich habe ich auch schon damit zu tun (im Telefonbereich), auch hier ist die Akzeptanz eher mau! 😁
Trotzdem ließ mich der Gedanke nicht los, mal zu versuchen meine Mädels als KI Charakter darzustellen. Das Modell 'FLUX' ist dafür am besten geeignet, Gesichter in einer guten Qualität darzustellen. Natürlich klappt dass nicht so, dass man einfach sagt/schreibt: mach mir ein Bild mit Cathy und Doro. Die KI kennt die beiden nicht (schade für die KI 😉). Also muss man eine Art Schablone haben (nennt sich LoRa), in der die Informationen stehen wie die beiden aussehen. Nach einer gewissen Einarbeitungszeit habe ich auch für beide eine LoRa-Datei erstellt und konnte sie in den Workflow mit einbinden. In dem Prompt zur Bildbeschreibung packt man dann das Trigger-Wort mit ein (Cathy oder Doro, je nach Figur) und 'hofft', dass das Ergebnis nah ans Original dran kommt.
Für mich hat diese KI Bilderstellung immer noch was von 'Würfelspiel'; mal hat man volle Punktzahl, manchmal aber auch eher nicht.
Leider kann man aktuell nur eine Figur darstellen, die KI ist da leider noch nicht soweit, zwei Figuren so darzustellen wie man es möchte. Zumindest nicht, ohne einen Workflow in ComfyUI zu erstellen, der Komplexer ist, als eine Vorlesung in Raketenphysik. 😉 Auch ist das Beschreiben des Bildinhaltes sehr ermüdend, zumal das Ergebnis dann doch vom Erwarteten sehr abweicht.
Hier also mal ein paar Demobilder: