KI Challenge – Olesia Special: Einsatz und Gestaltung von KI-generierten Bildern und Videos mit Midjourney, Nano Banana und Higgsfield
Die Session behandelt die Erstellung von KI-generierten Bildern und Videos mit Tools wie Midjourney, Nano Banana Pro und Higgsfield. Es wird gezeigt, wie man Bilder stilistisch personalisiert, Prompts strukturiert und realistische Darstellungen, etwa von Personen in bestimmten Situationen, erzeugt.
Die Session vermittelt praxisnah den Umgang mit KI-basierten Tools wie Midjourney, Nano Banana Pro und Higgsfield zur Erstellung und Gestaltung von Bildern und Videos. Olesia Panchenko erläutert die Bedeutung von präzisen Prompts, iterativer Verbesserung und stilistischer Personalisierung im KI-gestützten Visual-Storytelling.
👉 Und wer noch ein bisschen mehr Olesia will – mit einem leicht anderen Thema 🧚✨ https://beautyfrequency.hypnophotography.com/
Einführung in die KI-gestützte Bild- und Videokreation
In der heutigen digitalen Welt gewinnen KI-gesteuerte Werkzeuge für die Bild- und Videoproduktion zunehmend an Bedeutung. Die Session mit Olesia Panchenko, einer erfahrenen Fotografin und Entwicklerin kreativer KI-Workflows, zeigte praxisorientiert, wie verschiedene Plattformen miteinander kombiniert werden können, um individuelle und realistische Darstellungen zu erzeugen.
Wichtig ist zu verstehen, dass es keine „Wunderlösung“ gibt: Ein gutes Bild oder Video entsteht nicht per Knopfdruck, sondern erfordert sorgfältige Planung, iterative Abstimmung und ein klares Storytelling. Olesia unterstrich, dass sowohl eine präzise Kommunikation mit der KI per klar strukturierter Aufforderung („Prompt“) als auch „zeigen statt nur sagen“ entscheidend sind.
Die Werkzeuge im Überblick: Midjourney, Nano Banana Pro und Higgsfield
Die Session begann mit einer Vorstellung der eingesetzten Tools:
- Midjourney: Ein älteres, etabliertes KI-Tool, das sich durch seine Fähigkeit zur stilistischen Bildgestaltung mit hoher Detailtiefe auszeichnet. Midjourney eignet sich besonders, um den „Look & Feel“ eines Bildes oder einer Serie zu formen und erste kreative Bildideen zu generieren. Vorteilhaft ist die Möglichkeit, über Bild-Referenzen (Moodboards) und Personalisierungen die Ästhetik stark an die eigene visuelle Sprache anzupassen.
- Nano Banana Pro: Diese Plattform ist darauf spezialisiert, realistische Details zu erhalten, Gesichter mit hoher Ähnlichkeit abzubilden und verschiedene Variationen (etwa Outfits, Hintergründe, Posen) eines Bildmotivs zu erzeugen. Hier liegt die Stärke in der Umsetzung und Feinarbeit.
- Higgsfield: Eine vielseitige Plattform, die verschiedene Bild- und Videowerkzeuge bündelt. Higgsfield erlaubt es, ohne individuellen Account bei mehreren Tools zu arbeiten und bietet Funktionen für Charaktererstellung („Soul-ID-Charakter“) sowie Videoanimationen über Clink AI und weitere Engines.
Diese Tools ergänzen sich ideal: Midjourney dient dem Entwurf und der Stilfindung, Nano Banana Pro der präzisen Ausarbeitung, und Higgsfield als zentraler Hub zur Verwaltung und Produktion komplexerer Workflows inklusive Video.

Schlüssel zur Bildgestaltung: Prompt-Architektur und visuelle Referenzen
Ein zentrales Thema der Session war die promptbasierte Kommunikation mit der KI. Olesia erklärte anschaulich die „Anatomie“ eines guten Prompts, der nicht nur beschreibt, was im Bild zu sehen sein soll, sondern auch Struktur enthält:
- Worum geht es? Zum Beispiel: „Eine Frau in einem roten Kleid“
- Was passiert? (z.B. „lächelt“, „steht im Lavendelfeld“)
- Wo findet es statt? („bei Sonnenuntergang“, „im Studio“)
- Wann? („Abendstimmung“)
- Technische Details: Licht, Linse, Bildausschnitt, Style
Beispiel: „Junge Frau Bea in rotem Kleid, lächelnd, steht im Lavendelfeld bei Sonnenuntergang, natürliche Lichtstimmung, Fokus auf Gesicht, Portraitaufnahme mit geringer Tiefenschärfe.“
Sehr hilfreich sind visuelle Moodboards, etwa auf Pinterest, mit Motiven, die Stil und Technik illustrieren. Diese können der KI als Bildreferenz zusammen mit dem Textprompt gegeben werden, was eine präzisere Steuerung der Ergebnisse ermöglicht. Gerade bei technisch kaum versierten Nutzern kann die KI via ChatGPT dazu angeregt werden, passende technische Parameter (z.B. Kameraeinstellungen, Beleuchtung) zu generieren.
Realistische Personenabbildung mit KI: Herausforderung und Lösungswege
Die Nachbildung des eigenen Gesichts in realistischen Situationen ist eine anspruchsvolle Aufgabe. Olesia zeigte an einem eigenen Projekt – dem „Madonna Project“ –, wie mehrere Versuchsdurchläufe notwendig sind, bis die Bildqualität und Ähnlichkeit akzeptabel ist. Anfangs entstehen oft unscharfe, stilistisch uneinheitliche oder sogar verzerrte Bilder, die man als „grässlich“ bezeichnen kann.
Wichtig ist dabei:
- Referenzbilder vom eigenen Gesicht: Am besten gut ausgeleuchtete Portraitaufnahmen vor neutralem Hintergrund in unterschiedlichen Perspektiven.
- Modulare Bildzusammensetzung: Einfügen von Bildern für Gesicht, Kleidung, Hintergrund und weiteres über Nano Banana Pro.
- Iterative Verbesserung: Mehrere Durchläufe, jeweils Korrekturen an Prompts und Referenzdaten anpassen.
- Stilistische Referenzbilder: Beispielsweise das Ausgangsbild in Midjourney so gestalten, dass Stil und Look des finalen Bildsets definiert sind.
Fortgeschrittene Nutzer können sogenannte „Loras“ verwenden – Modelle, die auf einer größeren Anzahl eigener Fotos trainiert werden, um eine bessere Ähnlichkeit und Konsistenz zu erzielen. Dieses Vorgehen ist komplexer und zeitaufwändiger.
Beispiele aus der Praxis: Szenen und Variationen erzeugen
Ein typisches Anliegen in der Session war eine Berufssituation realistisch abzubilden, etwa ein Interview mit einer Führungskraft in einem professionellen Studio-Setting.
Die Vorgehensweise:
- Erstellt wird ein Basisbild einer Szene, entweder durch Sammlung existierender Fotos oder per KI-Generierung mit Midjourney.
- Dieses Basisbild dient als Referenz bei Nano Banana Pro, in das das eigene Gesicht und weitere Elemente flexibel eingefügt werden.
- Der Prompt beschreibt genau Lokalität, Pose, Emotion (z.B. Haltung und Mimik eines unsicheren Gesprächspartners), Licht und Bildausschnitt.
- Im Video-Modus (etwa bei Clink AI) können Kamerabewegungen, Objektbewegungen und die Hintergrundanimation separat beschrieben werden – wichtig für kontrollierte Storytelling-Animationen.
Das Prinzip lautet: Die KI ist ein Assistent, dem wir mit Gedanken-, Bild- und Textvorlagen möglichst eindeutige Anweisungen geben müssen. Je genauer die Beschreibung – etwa „Close-Up“, „Portrait mit 85mm Linse“, „freundliche aber konzentrierte Mimik“ –, desto zielgenauer wird das Ergebnis.
Videokreation: Von der Bildvorlage zur Animation
Aus Bildern wird durch verschiedene Werkzeuge Videocontent generiert. Olesia nutzte als Beispiel Clink AI, einen bewährten Video-Generator, der mit unterschiedlichen Modellen arbeitet und eine Reihe von Parametern bietet: Auflösung, Seitenverhältnis, Dauer, Anzahl der Outputs.
Wichtig bei bewegtem Bild sind drei Aspekte der Animation:
- Kamerabewegung: Zoom, Dolly-Shot, Schwenk, Position zum Objekt
- Objektbewegung: Wie bewegt sich die dargestellte Person oder das Hauptmotiv?
- Hintergrundbewegung: Objekte im Bildhintergrund lenken Atmosphäre und Dynamik
Dabei gilt: Je präziser die Beschreibung, desto besser das Ergebnis. KI kann komplexe Bewegungen zwar generieren, aber ohne genaue Steuerung oft nur unkontrollierte Effekte liefern. Deshalb empfiehlt Olesia immer strukturiertes Prompting und das Einstellen der Parameter mit Bedacht.
Oft werden Bilder vor der Animation mit Tools wie Magnific AI hochskaliert, um die Qualität zu erhöhen. Dies ist essenziell, damit die Ausgangsbilder – die animiert werden sollen – eine hohe Detailtreue haben.
Praxisnahe Empfehlungen und Herausforderungen
Olesias Erfahrungen aus der Praxis fördern folgende Erkenntnisse zutage:
- Iteratives Arbeiten ist normal: Bilder und Videos entstehen selten in einem Schritt perfekt. Oft werden 30 bis 40 Durchläufe benötigt, besonders für animierte Frames.
- Zeitaufwand für Personalisierung: Die Erstellung eines persönlichen Stils, etwa durch Midjourney-Personalisierungen, dauert mehrere Stunden Trainingszeit, lohnt sich aber für sehr individuelle Ergebnisse.
- Kombination verschiedener Tools: Die Kombination von Midjourney (für Stilfindung), Nano Banana (für Darstellung und Vielfalt) und Higgsfield (für Workflow, Charaktere und Video) ist eine effektive Strategie.
- Promptstruktur ist entscheidend: Die Reihenfolge und Präzision der Eingaben entscheidet über das Ergebnis. Wichtig ist, stets das Hauptobjekt zuerst zu nennen, dann Details, dann Umgebung und Stimmung, zuletzt technische Details.
- Technisches Basiswissen hilft: Zwar kann KI auch Laien Unterstützung bieten (z.B. ChatGPT generiert fotografische Details), aber ein Grundverständnis von Fotografie und Bildgestaltung ist von Vorteil.
- Die KI ist ein Tool, kein Zauberkasten: Trotz aller Möglichkeiten verbleibt die KI ein „Assistent“, der klare Vorgaben braucht. Emotionalisierung in Prompts sollte sparsam und möglichst nicht technisch vermischt werden.
Fazit: Realistische und stilistisch individuelle KI-Bilder und Videos erfordern Planung und Iteration
Die Session von Olesia Panchenko bot einen tiefen Einblick in die komplexe Welt der KI-gestützten Bild- und Videogestaltung. Im Kern gilt: Klare Zieldefinition („Was will ich erzählen?“), strukturierte Promptgestaltung und die Nutzung von Referenzbildern sind entscheidend, um realistische und gleichzeitig kreative visuelle Ergebnisse zu erzielen.
Die vorgestellten Tools – Midjourney, Nano Banana Pro und Higgsfield – zeigen sich dabei in komplementären Rollen, von der ästhetischen Stilfindung bis zur detailgetreuen Umsetzung und Animation. Wer erfolgreich arbeiten möchte, sollte sich auf einen iterativen Prozess einstellen, bei dem viele Versuche nötig sind, bis die Bildqualität und Ähnlichkeit den Erwartungen entsprechen.
Für den professionellen Einsatz, etwa für Coaching-Szenen oder personalisierte Social-Media-Bilder, ist es ratsam, Zeit in die Vorbereitung (eigene Fotos, Moodboards) und Promptstrukturierung zu investieren. Damit können KI-Bilder und Videos nicht nur repräsentativ wirken, sondern auch die eigene Persönlichkeit und Geschichte authentisch transportieren.
Letztendlich ist KI in der Bild- und Videoproduktion ein Werkzeug unter vielen – es ergänzt die eigene Kreativität, ersetzt aber keine fundierte Planung und gestalterische Kompetenz. Wer dies beachtet, eröffnet sich spannende neue Wege für das visuelle Storytelling.