KI Bildgenerierung für Autoren – Romanfiguren visualisieren
Mit KI kannst du deine Romanfiguren erstmals realistisch visualisieren. Gute Bilder entstehen durch präzise Prompts und ein paar einfache Techniken. In diesem Beitrag erfährst du, wie du KI-Werkzeuge sinnvoll nutzt, typische Fehler vermeidest und zu einheitlichen Darstellungen deiner Charaktere gelangst.
Dank Künstlicher Intelligenz können Autoren heute ein konkretes Bild ihrer Romanfiguren erschaffen. Früher blieb die Optik einer Figur der Vorstellungskraft vorbehalten oder musste über Illustrationen erarbeitet werden. Heute genügt ein Prompt, also eine Texteingabe, die der KI sagt, was sie erzeugen soll, um einen Charakter sichtbar zu machen. So gewinnen Autoren ein klares Bild über ihre Figuren und können sie zugleich den Lesern präsentieren.

Doch der scheinbar einfache Prozess der Bildgenerierung birgt Herausforderungen: KI-Bilder sind oft uneinheitlich, sie spiegeln den Charakter einer Romanfigur nicht immer korrekt wider oder die Hintergründe passen nicht zum Genre. Mit detaillierten Prompts lassen sich deutlich stimmigere Bilder deiner Romanfiguren generieren.
In diesem Beitrag erfährst du, wie du mit Hilfe von KI-Tools wie ChatGPT, Gemini oder ähnlichen Bildgeneratoren möglichst einheitliche und ausdrucksstarke Bilder deiner Romanfiguren erstellst.
Wie funktioniert KI-Bildgenerierung?
Wie erzeugt eine KI eigentlich Bilder? Die Bilderstellung basiert auf Millionen von Trainingsdaten. Künstliche Intelligenz nimmt deinen Prompt (also deine Beschreibung) auf und kombiniert daraus Muster, die zu deinen Angaben passen. So kann sie zum Beispiel eine junge, blonde Frau mit blauen Augen erstellen. Lässt du anschließend erneut ein Bild der Figur erstellen, erhältst du im Regelfall ein anderes Ergebnis, was mit der ersten Darstellung nur wenig gemeinsam hat.
Der Grund dafür ist einfach: Jedes KI-Bild ist eine Neukombination aus unzähligen Mustern. Für Autoren kann es problematisch sein, wenn sie Wert auf eine eigentliche Darstellung ihrer Figuren legen. Gleichzeitig hat diese Vielfalt auch Vorteile: KI ermöglicht dir, eine allgemeine Vorstellung von einer Figur zu bekommen. Es kann inspirierend sein, deinen Charakter in verschiedenen Facetten zu sehen.
Die Rolle der Prompts bei der KI-Bildgenerierung
Gerade bei der Erstellung von Bildern ist es entscheidend, deine Figur möglichst präzise zu beschreiben. Wenn du lediglich schreibst, die KI solle eine „junge, blonde Frau mit langen Haaren“ generieren, werden die Ergebnisse meist austauschbar und wenig charakteristisch. Beschreibe bei einem Charakter so viele Details wie möglich.
Welche Mimik zeigt die Figur? Wie ist ihre Körperhaltung? Hat sie eine bestimmte Frisur oder ein markantes Merkmal? Welche Kleidung trägt sie? Solche Angaben helfen der KI enorm bei der Bilderstellung. Die Beschreibung der Körperform kann ebenfalls sinnvoll sein, doch gerade bei weiblichen oder jungen Figuren ist eine gewisse Zurückhaltung angebracht. Oft genügt es, allgemeine Hinweise zur Statur zu geben, wenn du ein erstes visuelles Gefühl für deine Figur gewinnen möchtest.
Ebenso wichtig ist der Hintergrund einer Szene. Wenn du zum Beispiel ein Bauernmädchen für einen Fantasy Roman visualisierst, kann KI trotzdem einen modernen Stadtpark als Hintergrund erzeugen. Das liegt daran, dass sie oft auf Fotos von Menschen in Kostümen zurückgreift, etwa von Mittelaltermärkten oder Rollenspielen. Ein klar formulierter Kontext hilft, solche Fehlinterpretationen zu vermeiden.
Das Nova-Projekt
Um die Problematik uneinheitlicher KI-Darstellungen zu verdeutlichen, möchte ich ein Beispiel aus meinem dystopischen Romanprojekt vorstellen: „Dr. Magnus Martell arbeitet in einem isolierten Forschungskomplex an einem Regierungsprojekt. Ihm wurde Nova als sogenannte Gesellschafterin zugeteilt. Gesellschafterinnen sind junge Frauen, die einer mentalen Umprogrammierung unterzogen wurden. Sie sollen ihre Wissenschaftler bekochen, unterhalten und euphemistisch gesprochen körperliche Nähe bieten. Der Staat verspricht sich davon eine höhere Produktivität.
Dr. Martell lehnt dieses System ab und begegnet Nova mit Respekt. Mit der Zeit gelingt es ihm, ihre Konditionierung aufzubrechen und beide Figuren entwickeln Zuneigung. Durch Zufall wird die Presse auf diese Beziehung aufmerksam und sie werden zu Symbolfiguren des Widerstands.“
Die KI-Bilder aus diesem Projekt zeigen gut, wie stark Darstellungen variieren können.

Das erste Bild zeigt Nova bei ihrer Ankunft im Komplex, es verdeutlicht noch nicht die Charaktertiefe der Figur. Der Hintergrund des Fotos zeigt die Grundstimmung des Settings, beide Figuren bewegen sich in einem sterilen Komplex, der viel zu groß für zwei Menschen ist.
Das zweite Bild zeigt sie vor der Presse. Hier wirkt Nova puppenhaft. Während dieser Handlungsphase wird sie von der Presse als elfengleich idealisiert, was sich in der KI-Bilderstellung niederschlägt, die sich am Storytelling orientiert. Das letzte Bild stellt einen Wutanfall von Nova im Streit mit Magnus in seinem Zimmer dar. Ihre Mimik ist ausdrucksstark und lebendig, doch der Hintergrund wirkt falsch: Statt eines sterilen Forschungszimmers zeigt die KI ein generisches Hotelzimmer, was verdeutlicht, wie Bildgeneratoren vom gewünschten Setting abweichen können.
Einheitliche Darstellung von KI-Bildern
An den drei Bildern kann man deutlich erkennen: Die KI versteht das optische Grundprinzip der Figur, jedoch handelt es sich bei den Darstellungen um drei unterschiedliche Frauen, die in der Realität so existieren könnten. Wer generierte Bilder seiner Charaktere zum Beispiel für die Bewerbung seines Romans nutzen möchte, legt großen Wert auf eine einheitliche Darstellung der Figuren.
Es gibt verschiedene Strategien für eine einheitliche optische Darstellung von Charakteren. Erstelle in einem ersten Schritt eine Vielzahl von Bildern zu einer deiner Figuren. Wähle in einem zweiten Schritt acht bis zehn Bilder aus, welche die Optik deiner Figur besonders gut wiedergeben. Lade diese Bilder anschließend bei ChatGPT hoch, hier funktioniert es besonders zuverlässig, und lasse dir einen Metaprompt als Beschreibung für deine Figur erstellen. Diese oft sehr umfangreiche Beschreibung kannst du als einheitliche Grundlage für die Generierung weiterer KI-Bilder nutzen.
Arbeite mit Referenzbildern
Oft funktioniert die Arbeit mit Referenzbildern noch besser. Irgendwann musst du als Autor entscheiden, welche der verschiedenen optischen Varianten deiner Figur du bevorzugst. Du kannst dann folgenden Prompt formulieren: „Ich schicke dir gleich ein Referenzbild, nimm das Bild als Orientierung für weitere Bilder.“ Gerade Google Gemini kann zuverlässig ähnliche Bilder anhand von Referenzen erzeugen.
Was auch passieren kann: Künstliche Intelligenz weigert sich mitunter, anhand bestimmter Referenzbilder weitere Bilder zu erstellen. Als ich ein Bild von Magnus und Nova als Vorlage hochlud, verweigerte ChatGPT die Weiterverarbeitung, da angeblich echte Personen dargestellt seien. Auch der Hinweis, dass es sich um ein von ChatGPT generiertes Bild handelt, änderte nichts an dieser Einschätzung.
KI-Bildgenerierung bei Science Fiction und Fantasy
In bestimmten Genres wie Fantasy und Science Fiction ist es oft schwierig, realistische Bilder zu erzeugen. Von KI generierte Bilder wirken in diesen Fällen schnell wie Szenen aus einer Visual Novel. Dies gilt besonders, wenn du als Autor ausgefallene Hintergründe wie einen Dungeon oder eine futuristische Weltraumstation wählst. In solchen Umgebungen kann die KI nur auf eine begrenzte Anzahl visueller Muster zurückgreifen.

In meinem dystopischen Projekt existiert ein Holoraum, in dem sich virtuelle Welten generieren lassen. Magnus und Nova nutzen diesen Raum als persönlichen Zufluchtsort. KI-Bilder, die Szenen aus dem Holoraum darstellen sollen, sind nie vollkommen realistisch. Ein Beispiel ist ein Bild von Nova in einem rekonstruierten Atlantis unter dem Meer, das Magnus später Nova Atlantis nennt.
Du kannst dir bei solchen Szenen helfen, indem du mit exakten Prompts arbeitest und weniger extravagante Schauplätze wählst. Lasse dir zum Beispiel ein Bild von einem Ritter im Burghof generieren. Auch Darstellungen in Raumschiffen funktionieren bei gründlicher Beschreibung gut, weil die KI hier auf Muster aus Filmen und Serien zurückgreifen kann.
Fazit des Buchinsiders: So erstellst du schöne KI-Bilder
KI kann Romanfiguren sichtbar machen, doch gute Bilder entstehen nur mit Übung, präzisen Prompts und Geduld. Viele Ergebnisse sind anfangs enttäuschend, aber mit der Zeit lernst du, wie du die KI zu überzeugenden Darstellungen führst.