Von grauem Himmel zu Sonnenschein: Foto-Magie mit Google Gemini
Kurz & bündig
Frage: Was ist „Nano Banana“ und warum ist es spannend?
Antwort: „Nano Banana“ ist Googles neue, kostenlose Bild-KI in der Gemini-App (mit Tageslimits). Sie spezialisiert sich auf Bearbeitung realer Fotos (Hintergrund tauschen, Objekte entfernen/hinzufügen, Stil übertragen) statt reiner Neugenerierung – mit hoher Konsistenz bei Personen & Objekten. Die Entwickler-API ist kostenpflichtig (sehr günstig pro Bild).
Was ist „Nano Banana“ (Gemini 2.5 Flash Image)?
„Nano Banana“ ist der interne Spitzname für Gemini 2.5 Flash Image, Googles aktuelles Bild-KI-Modell in der Gemini-App. Im Fokus steht gezielte Bearbeitung deiner vorhandenen Fotos mit natürlicher Beleuchtung, korrekten Schatten und hoher Personen-/Objekt-Konsistenz. Entwicklern steht das Modell zudem über Google AI Studio & Vertex AI als API zur Verfügung (sehr günstiger Bildpreis).
Schnellstart: In 5 Schritten zum Ergebnis
- Öffne die Gemini-App (Web oder mobil) und wähle Bild aus.
- Foto hochladen (z. B. Porträt, Produktfoto, altes Familienbild).
- Aufgabe kurz beschreiben: z. B. „ersetze den grauen Himmel durch Sonnenschein.“
- Feintuning: Falls nötig, mit einem zweiten Prompt nachschärfen (z. B. „deutlicher Schatten“, „lösche den Baum im Hintergrund“).
- Export: Ergebnis speichern; SynthID-Wasserzeichen bleibt unsichtbar eingebettet.
Praxis: Typische Anwendungsfälle
- Hintergründe austauschen – stimmige Beleuchtung & Schatten, natürliche Übergänge (Haare, transparente Kanten).
- Objekte entfernen/hinzufügen – störende Elemente verschwinden, realistische Ergänzungen (z. B. Deko, Pflanzen, Requisiten).
- Stil-Transfer – vom Foto zum „Ölgemälde“-Look oder dezenter Farb-/Kontrast-Stimmung ohne Filter-Matsch.
- Mehrere Bilder verschmelzen – Personen/Objekte aus mehreren Fotos konsistent zusammenfügen (Familien-/Teamfotos).
- Produktfotografie – neutrale Freisteller in glaubwürdige Szenen setzen (Küche, Garten, Werkstatt).
Bisherige KI-Bild-Tools
-
Midjourney, DALL·E 3, Stable Diffusion, Firefly → funktionieren alle nach dem Prinzip: Textprompt rein → Bild raus.
-
Sie erwarten in der Regel klare, strukturierte Prompts (z. B. „a cat sitting on a red chair, photorealistic, 8k, cinematic lighting“). Die meisten Anwendungen tun sich mit deutscher Sprache sehr schwer. Es sollten vorzugsweise die Prompts in englischer Sprache eingegeben werden.
-
Wenn der Prompt ungenau ist, sind die Ergebnisse oft unvorhersehbar oder unbrauchbar.
👉 Sprache wie in einem Gespräch verstehen diese Tools nur eingeschränkt. Man muss eher in Stichworten und mit Zusatzparametern arbeiten.
Was macht Nano Banana (Gemini 2.5 Flash Image) anders?
-
Nano Banana → es kombiniert Bildbearbeitung mit dem Gemini-Chat, d. h. du kannst eher in natürlicher Sprache formulieren.
-
Beispiel: Midjourney → „remove background, replace with sunny beach, photorealistic“
Nano Banana → „Bitte entferne den grauen Himmel und mach daraus einen sonnigen Strandtag“ -
Der Unterschied: Gemini verarbeitet deine Anweisung wie ein Chat – du kannst nachhaken („etwas mehr Sonnenuntergang“, „mach den Schatten weicher“), ohne jedes Mal den gesamten Prompt neu zu schreiben.
ChatGPT als Helfer für deine Bild-Prompts
Auch wenn ChatGPT selbst keine Bilder erzeugt oder bearbeitet, kann es dir als Prompt-Assistent enorm weiterhelfen. Du kannst hier in normaler Sprache beschreiben, was du dir vorstellst – und ich formuliere daraus einen optimalen Prompt für Bild-KIs wie Google Gemini (Nano Banana), Midjourney oder Adobe Firefly. So vermeidest du frustrierende Fehlversuche und sparst Zeit.
→ ChatGPT schlägt dir vor: „Replace cloudy sky with bright summer beach setting, adjust shadows and lighting to sunny daylight.“
Den fertigen Prompt kannst du dann direkt in deiner Bild-KI nutzen.
Damit wird ChatGPT zum praktischen Zwischenschritt zwischen deiner Idee und dem fertigen Bild – besonders hilfreich, wenn du dich mit der speziellen „Prompt-Sprache“ der Tools noch nicht so wohlfühlst.
Über die ChatGPT-App gibt es zwar eine Integration mit DALL·E 3 – dadurch denken viele, ChatGPT selbst könne Bilder erzeugen. Tatsächlich übernimmt aber DALL·E 3 die Bildgenerierung, während ChatGPT nur die Steuerung per Prompt erleichtert.
Nicht nur bearbeiten – auch neue Bilder erstellen
Auch wenn Nano Banana (Gemini 2.5 Flash Image) vor allem für die Bearbeitung bestehender Fotos bekannt ist, darf man nicht vergessen: Mit Google Gemini lassen sich auch komplett neue Bilder aus Text-Beschreibungen generieren. Das funktioniert ähnlich wie bei DALL·E oder Midjourney. Du kannst also nicht nur ein vorhandenes Bild optimieren, sondern auch völlig neue Motive erstellen, indem du deine Idee einfach in einem Satz beschreibst.
Google wechselt im Hintergrund automatisch das Modell zur Bilderstellung – darum musst du dich nicht kümmern. Wir erwähnen das nur, falls dir einmal jemand sagt: „Das stimmt doch gar nicht, Nano Banana kann nur Bilder verändern.“
Damit deckt Gemini beide Welten ab: Bildgenerierung und Bildbearbeitung. Für dich bedeutet das maximale Flexibilität – egal, ob du ein völlig neues Motiv brauchst oder nur ein vorhandenes Foto realistischer gestalten möchtest.
Vergleich: Nano Banana vs. DALL·E 3 vs. Midjourney vs. Firef
| Was kann es besonders gut? | Nano Banana (Gemini) | DALL·E 3 | Midjourney | Adobe Firefly |
|---|---|---|---|---|
| Bestehende Fotos realistisch verbessern | ✔️ | ❌ | ❌ | ✔️ |
| Neue Bilder aus Text erstellen | ✔️ | ✔️ | ✔️ | ✔️ |
| Künstlerische Stile/Fantasie | ➖ teils | ✔️ | ✔️ | ✔️ |
| Wie komme ich ran? | Nano Banana (Gemini) | DALL·E 3 | Midjourney | Adobe Firefly |
|---|---|---|---|---|
| Eigene App/Webseite | Gemini-App/Webseite | Website/OpenAI | Discord (Chat-App) | Adobe-Webseite |
| Anmeldung/Abo nötig | Google-Konto | Anmeldung | Abo | Creative Cloud-Abo |
| Was kostet es? | Nano Banana (Gemini) | DALL·E 3 | Midjourney | Adobe Firefly |
|---|---|---|---|---|
| Kostenlos mit Tageslimits | ✔️ | ❌ | ❌ | ❌ |
| Kostenpflichtige Nutzung | Bei häufigem Gebrauch | ✔️ | ✔️ | Im Adobe-Abo enthalten |
Grenzen & Stolpersteine
- Extrem kreative Fantasiewelten gelingen manchmal mit anderen Programmen schneller, die speziell für das Erfinden neuer Bilder gemacht sind.
- Sehr komplexe Bearbeitungen (wenn du also viele Details auf einmal ändern möchtest), brauchen oft mehrere einzelne Befehle/nacheinander.
- Bilder-Limits: In der kostenlosen Gemini-App kannst du pro Tag nur eine bestimmte Anzahl an Bildern erstellen
Wenn du sehr viele Bilder machen willst (z. B. für ein größeres Fotoprojekt), gibt es kostenpflichtige Profi-Versionen – für die normale private Nutzung reichen die App-Limits aber meist aus
Datenschutz, Nutzung & SynthID-Wasserzeichen
- SynthID: unsichtbare Markierung, die KI-Erstellung/-Bearbeitung kennzeichnet.
- Nutzungsrechte: Für kommerzielle Nutzung gelten Googles Gemini-/Cloud-Bedingungen; prüfe Marken/Personenrechte separat.
Gib in keiner KI persönliche Daten wie Namen, Adressen oder Gesundheitsinformationen ein. Behandle KI-Assistenten wie öffentliche Helfer – höflich und hilfsbereit, aber nicht für private Geheimnisse. Bei den meisten kostenlosen KI-Tools werden die eingegebenen Texte oder Bilder anonym zur Verbesserung der Systeme genutzt. In Bezahl-Abos kannst du in der Regel unter den Einstellungen festlegen, dass deine Daten nicht zum Training verwendet werden.
FAQ
Ist Nano Banana kostenlos?
Gemini-App: Ja, mit Tageslimits. API/Vertex: kostenpflichtig, sehr günstiger Bildpreis.
Kann ich Deutsch prompten?
Ja, Nano Banana arbeitet in der Gemini-App mehrsprachig. Klare, kurze Anweisungen liefern die besten Resultate.
Wie erhalte ich konsistente Ergebnisse?
Arbeite iterativ: Erst Hauptänderung, dann Feinschliff (z. B. Schatten/Reflexe). Nutze bei Bedarf Referenzbilder.
Wie erkennt man KI-Bilder?
Gemini-Outputs tragen SynthID. Für Dritte gibt es einen öffentlichen Detector-Zugang.
Rechtliches?
Urheber-, Marken-, Persönlichkeitsrechte prüfen (Logos, geschützte Designs, erkennbare Personen).
Weiterführende Links
- Google Blog: Neues Bild-Editing in Gemini (Nano Banana)
- Developer Blog: Einführung Gemini 2.5 Flash Image (aka nano-banana)
- Gemini API: Preise (inkl. Bildkosten)
- SynthID – technische Infos & Richtlinien
- heise: Nano-Banana bestätigt & Einordnung
Interne Links
- Bild-KI-Anbieter im Vergleich: Welcher passt zu dir?
- KI-Tools für kreative Projekte: Überblick & Bewertung
Persönliche Anmerkung:
Hier zeigen wir euch, mit welchen Prompts (Befehlen) wir das nachstehende vorhandene Bild abgeändert haben, sodass ihr das als Ausgangsbasis für eure ersten Übungen nehmen könnt.
Ausgangsbild

Wir vor dem Eifelturm
Wir haben das Bild zuerst hochgeladen. Klicke dazu auf das + Zeichen und lade dann deine Vorlage/Bild in Google hoch

Prompt: Bitte wandele das Bild um. Das Paar steht vor dem Eiffelturm in Paris, sonniger Tag, beide tragen ihre gestreiften Shirts und lächeln in die Kamera. Im Hintergrund Touristen und ein blauer Himmel.

Im nächsten Beispiel wurde Ort und Kleidung geänder
Prompt: jetzt ändere das Referenzbild wie folgt; Die beiden stehen auf einer Aussichtsplattform in den Alpen, hinter ihnen verschneite Berge und blauer Himmel, beide tragen Outdoor-Jacken und dicke Pullover

Jetzt als Comic Superhelden
Prompt: verwende das Referenzbild – Mache aus den beiden Personen Comic-Superhelden, die über der Stadt fliegen. Beide tragen passende Kostüme mit Cape und Brille, aber die Streifen-Shirts bleiben erkennbar.

Wer kennt sie nicht – die Simpsons am Steinhuder Meer
Prompt: nehme das referenzbild – Zeichne das Paar im Simpsons-Stil, wie sie in Springfield am See spazieren, beide tragen ihre gestreiften Oberteile.

Plakt zum Film ‚Mission AI‘
Prompt: nehme das Referenzbild. Gestalte ein Filmplakat mit den beiden Personen als Hauptdarsteller in einem Actionfilm, Titel: ‘Mission AI – Operation Zukunft‘. Beide wirken cool, mit Sonnenbrillen und futuristischem Hintergrund.
… um euch auf einen typischen Fehler hinzuweisen, der bei sehr vielen KI’s noch immer passiert. Sie können leider in vielen Fällen nicht schreiben. Hier nutzen meist auch Hinweise wie „Schreibe Zukunft richtig – ZUKUNFT“ überhaupt nichts. Wenn es sehr auf Schrift ankommt, dann ist Flux.1 (Black Forest Labs – ein deutsches Unternehmen) ist momentan eines der besten Modelle. Man kann Flux allerdings nur beschränkt kostenlos nutzen.

Festgehalten auf Öl – für alle Ewigkeiten
Prompt: Verwandle die Szene in ein altes Gemälde aus dem 18. Jahrhundert, Ölmalerei, die beiden als adeliges Paar in feinen Kleidern

Wer hat nicht schon davon geträumt, ein Pirat zu sein
Prompt: nehme das Referenzbild. Mache aus den beiden Personen Piraten auf einem Segelschiff, mit Augenklappe, Hut und Schatzkiste.

Baue deine Visionen aus bunten LEGO®-Steinen
Prompt: Verwandle das Foto in eine Lego-Szene, die beiden als Lego-Figuren, das Meer aus Lego-Steinen.

Einmal auf dem roten Teppich zur Oskar-Verleihung
Das wollten wir uns natürlich auch nicht nehmen lassen. Einmal vor vielen Fotografen auf dem roten Teppich bei der Oskar-Verleihung dabei zu sein.
Prompt: nehme das Referenzbild – Setze die beiden mitten auf den roten Teppich der Oscar-Verleihung, mit Blitzlichtern, Kameras und glamourösem Hintergrund. Sie tragen beide festliche Kleidung

Das Bild zeigt uns zwar sehr eindeutig auf dem roten Teppich, aber die Kleidung wäre eigentlich eher für einen Opernbesuch das richtige gewesen. Deshalb haben wir den Prompt noch ein ganz kleinwenig abgewandelt:
Prompt: nehme das Referenzbild – Setze die beiden mitten auf den roten Teppich der Oscar-Verleihung, mit Blitzlichtern, Kameras und glamourösem Hintergrund. Das paar träge pompöse und auffällige Abendkleidung.
Damit wären wir dann sicherlich auch wirklich aufgefallen 🙂

… und jetzt seid ihr dran!
