Gemini: Musik erzeugen – Schritt für Schritt
Was ist Gemini, und kann es wirklich Musik erzeugen?
Gemini ist der KI-Assistent von Google – erreichbar im Browser, kostenlos nutzbar, gesteuert durch normale Sprache. Seit Anfang 2026 ist ein Musikgenerator eingebaut: das Modell Lyria 3. Du beschreibst, was du möchtest, und Gemini erzeugt daraus einen hörbaren Track – mit Melodie, Rhythmus, wahlweise auch Gesang. Kein Instrument, kein Notenwissen, keine Erfahrung nötig.
Was Gemini ist
Gemini wird von Google entwickelt und ist über gemini.google.com erreichbar. Ein Google-Konto genügt zur Anmeldung – wer bereits Gmail oder Google Drive nutzt, ist damit bereits angemeldet. Gemini ist ein KI-Assistent im klassischen Sinn: Du schreibst, es antwortet. Der Unterschied zu anderen Systemen ist, dass Gemini seit Februar 2026 auch Musik erzeugen kann – nicht als externe App, sondern direkt in der Oberfläche. Das zugrundeliegende Modell heißt Lyria 3 und stammt von Google DeepMind.
Wo Gemini bei Musik wirklich beeindruckt
Lyria 3 kann Musik aus einer einfachen deutschen Beschreibung erzeugen. „Ruhige Klaviermusik, etwas melancholisch, zwei Minuten“ – das reicht. Gemini erzeugt daraus einen vollständigen Instrumental-Track, den du sofort anhören kannst. Auch Stimmungsbeschreibungen funktionieren: „festlich, aber nicht aufdringlich“ wird erkannt und umgesetzt.
Besonders gut gelungen sind Instrumental-Tracks in gängigen westlichen Genres – Jazz, Klassik, Pop, Filmmusik. Das System verarbeitet auch Bilder als Vorlage: Wer ein Foto hochlädt, kann Gemini bitten, dazu passende Musik zu erzeugen. Mit einem Abo (AI Plus oder höher) steht Lyria 3 Pro zur Verfügung: bis zu drei Minuten Musik, mehr Kontrolle über Struktur wie Intro, Refrain und Bridge.
Wo die Grenzen liegen
Die kostenlose Version erzeugt Tracks bis zu 30 Sekunden. Das reicht für einen kurzen Jingle oder eine Kostprobe, nicht für ein vollständiges Lied. Für längere Musik braucht es ein Abo.
Für Gesang auf Deutsch ist die Qualität noch eingeschränkt. Gemini singt auf Deutsch, aber der Klang wirkt manchmal weniger natürlich als auf Englisch. Wer ein deutsches Lied mit Gesang möchte, sollte ein oder zwei Versionen erzeugen und die bessere behalten. Instrumentals auf Deutsch funktionieren ohne Einschränkung – hier spielt Sprache keine Rolle.
Die Kontrolle über feine Klangnuancen ist begrenzt: Wenn du sagst „Geige im Stil des Barock“, bekommst du manchmal eine Barockähnliche Stimmung, aber nicht immer genau das gewünschte Instrument in der gewünschten Spieltechnik. Mehrere Varianten erzeugen und die passendste auswählen ist der sinnvollste Weg.
Im Vergleich
Während ChatGPT und Claude beim Schreiben von Songtexten und musikalischen Ideen überzeugen, ist Gemini das einzige der vier großen KI-Systeme, das einen hörbaren Track erzeugt. Wer Musik nicht beschreiben, sondern anhören möchte, ist bei Gemini richtig.
So sieht das in der Praxis aus
Du möchtest zur nächsten Geburtstagsfeier etwas Persönliches beitragen – kein übliches Happy Birthday, sondern etwas das zur Jubilarin passt. Du öffnest Gemini, beschreibst den Stil und die Stimmung und gibst an, ob Gesang dabei sein soll. In etwa zwanzig Sekunden hörst du das Ergebnis. Wenn der Track nicht ganz passt, erzeugst du eine weitere Variante. Nach ein, zwei Versuchen hast du etwas, das klingt wie komponiert – nicht wie ein fertiger Popsong aus dem Radio, aber wie ein persönliches Stück für genau diesen Anlass.
Du hast Familienfotos von einem Urlaub in einer Bildschäu zusammengestellt. Jetzt brauchst du Musik dazu – ruhig, positiv, ohne Gesang, der von den Bildern ablenkt. Du lädst eines der Fotos in Gemini hoch und bittest es, dazu passende Hintergrundmusik zu erzeugen. Oder du beschreibst die Stimmung direkt: „Entspannte Sommermusik, mediterran, Gitarre und leichte Percussion, kein Gesang“. Das Ergebnis kannst du direkt als Hintergrundmusik in deinem Video-Editor verwenden.
Dein Verein feiert ein Jubiläum und du hast eine Präsentation vorbereitet. Zu Beginn soll kurze Musik gespielt werden – feierlich, nicht kitschig, genau fünfzehn Sekunden lang. Du gibst diese Angaben in Gemini ein und erzeugst zwei oder drei Varianten. Die beste nimmst du, die anderen löschst du. Kein Lizenzproblem für private und vereinsinterne Nutzung, kein Aufwand.
Wer längere Tracks, mehr Einfluss auf Gesangsstil oder andere Nutzungsbedingungen braucht, findet in der Reihe Apps mit KI Anleitungen zu spezialisierten Musik-Apps wie Suno, Udio und Soundraw. Diese sind ausschließlich für Musik gebaut und bieten in manchen Bereichen mehr Spielraum.
Direkt ausprobieren: So sprichst du mit Gemini
In Gemini gibst du deine Beschreibung als normalen Satz ein – das nennt man Prompt. Gemini liest ihn und erzeugt daraus die Musik. Je genauer du beschreibst, desto gezielter das Ergebnis. Hier sind drei Beschreibungen, die du direkt kopieren und in Gemini eingeben kannst:
Zum Kopieren:
Erstelle ruhige Klaviermusik, etwas melancholisch, ohne Gesang.
Was passiert dann?
Gemini erzeugt einen kurzen Klaviertrack in ruhiger, leicht wehmütiger Stimmung. Er klingt wie ein einfaches, nachdenkliches Klangstueck – passend als Hintergrundmusik oder als Kostprobe, wie KI-Musik klingt.
Warum funktioniert das gut?
Drei Angaben reichen für ein brauchbares Ergebnis: Instrument, Stimmung, ob Gesang dabei sein soll. Das ist das Minimum. Von hier aus kannst du die Beschreibung schrittweise erweitern.
Zum Kopieren:
Erstelle eine fröhliche Festmusik im Walzer-Stil, mit Geige und Klavier, ohne Gesang. Die Stimmung soll festlich, aber nicht übertrieben sein – passend für eine Familienfeier.
Was passiert dann?
Gemini erzeugt einen Instrumental-Track im Dreivierteltakt, mit Geigen- und Klavierklang in festlicher Stimmung. Das Ergebnis klingt wie Begleitmusik für einen feierlichen Moment – nicht wie ein Konzertsaal, aber eindeutig passend für eine Geburtstagsfeier oder ein Jubiläum.
Warum funktioniert das gut?
Stilangabe (Walzer), konkrete Instrumente, Zielkontext (Familienfeier) – so weiß Gemini genau, was gebraucht wird. Der Satz „nicht übertrieben“ hilft, kitschige Ergebnisse zu vermeiden.
Zum Kopieren:
Erstelle einen Instrumental-Track im Jazz-Stil, mit Piano, Kontrabass und sanftem Schlagzeug. Stimmung: entspannt und warm, wie ein Sonntagmorgen in einem kleinen Café. Kein Gesang, kein Elektronikelement. Die Melodie soll ruhig fließen, ohne zu viele Improvisationen.
Was passiert dann?
Gemini erzeugt einen Jazz-Track mit Piano als führender Stimme, Kontrabass im Hintergrund und einem dezenten, leisen Schlagzeug-Rhythmus. Das Ergebnis klingt wie Hintergrundmusik in einem ruhigen Lokal – warm, aber nicht aufdringlich.
Warum funktioniert das gut?
Drei Instrumente namentlich zu nennen, eine Bildwelt zu beschreiben („Sonntagmorgen im Café“) und explizit auszuschließen, was man nicht möchte (keine Elektronik, keine starke Improvisation) – das gibt Gemini einen sehr präzisen Rahmen. Das Ergebnis ist entsprechend gezielter.
Schnellstart – Schritt für Schritt
Schritt 1: Anmelden
- Seite aufrufen: Öffne gemini.google.com im Browser – Chrome, Firefox oder Edge funktionieren alle.
- Google-Konto: Klicke auf „Anmelden“ und gib deine Google-Kontodaten ein. Wer bereits Gmail nutzt, hat automatisch ein Google-Konto.
- Kein Konto vorhanden? Unter „Konto erstellen“ lässt sich kostenlos und in wenigen Minuten ein Google-Konto anlegen. Eine bestehende E-Mail-Adresse kann dafür genutzt werden.
- Altersprüfung: Die Musikgenerierung ist ab 18 Jahren freigegeben. Gemini fragt das Alter beim ersten Zugriff auf die Funktion ab.
Schritt 2: Musik erzeugen
- Textfeld öffnen: Im Hauptbereich von Gemini siehst du ein Eingabefeld mit der Aufforderung „Frag Gemini“. Hier tippst du deine Beschreibung ein.
- Beschreibung eingeben: Schreib, was du möchtest – zum Beispiel einen der Prompts aus dem Abschnitt oben. Du kannst auf Deutsch schreiben.
- Auf Senden klicken: Drücke Enter oder klicke auf den Sende-Pfeil. Gemini verarbeitet die Anfrage und erzeugt innerhalb von etwa zwanzig Sekunden einen Track.
Schritt 3: Ergebnis anhören und verfeinern
- Track abspielen: Das Ergebnis erscheint direkt unter deiner Eingabe als abspielbarer Player. Klicke auf Play.
- Variante erzeugen: Wenn der Track nicht ganz passt, schreib einfach „Noch eine Variante“ oder „Diesmal etwas fröhlicher“. Gemini erzeugt eine neue Version.
- Beschreibung anpassen: Wenn dir ein Element fehlt oder stört, ergänze oder ändere die Beschreibung gezielt: „Ohne Schlagzeug“ oder „Die Stimmung soll etwas wärmer klingen“.
Schritt 4: Track weiterverarbeiten
- Herunterladen: In der kostenlosen Version kannst du den Track in der Regel direkt über den Player herunterladen. Die genaue Funktion hängt von der aktuellen Version ab – der Download-Button erscheint neben dem Player.
- Weiterverwenden: Den heruntergeladenen Track kannst du in einem Video-Editor einfügen, auf einer Präsentation abspielen oder in eine Diashow einbetten.
- Nutzungsrechte: Für private, nicht-kommerzielle Zwecke kannst du die erzeugten Tracks ohne Einschränkung nutzen. Für öffentliche Veröffentlichung oder kommerzielle Nutzung solltest du die Nutzungsbedingungen kurz lesen.
Schritt 5: Erweiterte Möglichkeiten
- Lyria 3 Pro: Mit einem AI-Plus-Abo (7,99 €/Monat) oder höher steht Lyria 3 Pro zur Verfügung. Tracks bis zu drei Minuten Länge, mehr Kontrolle über Struktur: Intro, Refrain, Bridge können gezielt vorgegeben werden.
- Bild als Vorlage: Du kannst ein Foto hochladen und Gemini bitten, dazu passende Musik zu erzeugen. Das funktioniert gut für Landschafts- und Stimmungsfotos.
- MusicFX DJ: Über labs.google ist MusicFX DJ verfügbar – ein separates interaktives Tool, mit dem du Musik in Echtzeit steuern und anpassen kannst.
Typische Stolpersteine – und wie du sie vermeidest
Wenn das Ergebnis beliebig klingt und nicht zur gewünschten Stimmung passt, war die Beschreibung wahrscheinlich zu knapp. Ergänze konkrete Details: Name eines Instruments, eine Bildwelt („wie in einem alten Pariser Café“), oder was du ausdrücklich nicht möchtest („kein Schlagzeug“). Jedes zusätzliche Detail hilft Gemini, das Ergebnis einzugrenzen.
Für Gesangstexte auf Deutsch ist die Unterstützung noch im Aufbau. Wenn der deutsche Gesang nicht überzeugt, probiere zwei Dinge: entweder du erzeugst einen rein instrumentalen Track ohne Gesang, oder du beschreibst den gewünschten Text auf Englisch. Instrumentals funktionieren sprachunabhängig sehr gut.
Falls Gemini auf deine Musikanfrage nur mit Text antwortet statt einen Track zu erzeugen, prüfe zwei Dinge: Erstens, ob du mit einem Google-Konto angemeldet bist (kein Gastzugang). Zweitens, ob die Funktion in deiner Region verfügbar ist – Lyria 3 ist für Deutschland freigegeben. Manchmal hilft es, die Anfrage etwas direkter zu formulieren: „Erstelle Musik für mich:“ vor die Beschreibung setzen.
Was ist neu?
Google hat Lyria 3 im Februar 2026 direkt in die Gemini-App integriert – weltweit, auch für Deutschland. Seither ist Musikgenerierung kein separates Tool mehr, sondern Teil des normalen Gesprächs mit Gemini.
Quelle: Google Blog, Februar 2026
Für Nutzer mit AI-Plus-Abo oder höher steht Lyria 3 Pro zur Verfügung: Tracks bis zu drei Minuten Länge und mehr Kontrolle über Songstruktur (Intro, Refrain, Bridge).
Quelle: findskill.ai, Mai 2026
Recherche-Stand: 05/2026
Wichtige Hinweise
Gemini ist kostenlos nutzbar – die Musikgenerierung mit Lyria 3 ist in der Gratisfassung mit einer begrenzten Anzahl Tracks pro Tag möglich, jeder Track bis zu 30 Sekunden. Für längere Tracks und Lyria 3 Pro: AI Plus ab 7,99 €/Monat, AI Pro ab 21,99 €/Monat. Stand: 05/2026, Preise bei Google.
Gemini verarbeitet Eingaben auf Google-Servern in den USA. Alle mit Lyria 3 erzeugten Tracks tragen ein unsichtbares digitales Wasserzeichen (SynthID) – ein Hinweis darauf, dass der Track KI-erzeugt wurde, für den Klang irrelevant. Daten aus dem Gespräch können für die Modellverbesserung genutzt werden; ein Opt-out ist in den Google-Kontoeinstellungen möglich. Für private, nicht-öffentliche Nutzung der Tracks gibt es keine Einschränkungen.
Offizielle Links:
Gemini |
Lyria 3 Übersicht |
Preise |
Datenschutz
