A Google bejelentette, hogy a DeepMind csapata által fejlesztett Lyria 3 generatív zenei modell mostantól elérhető a Gemini alkalmazásban. A funkcióval a felhasználók szöveges utasítások vagy akár feltöltött képek alapján generálhatnak zenét.
A Gemini mára a Google generatív mesterséges intelligencia-eszközeinek elsődleges szolgáltatásává vált: egy „multimodális” AI-asszisztens, amely képes kérdésekre válaszolni, kutatást végezni, feladatokat automatizálni, valamint képeket és videókat létrehozni – számos más funkció mellett.
Szövegből vagy képből is készülhet zene
A Lyria 3 segítségével a felhasználók szöveges promptokkal generálhatnak zenét – például egy adott műfaj, hangulat vagy történet leírásával. A rendszer automatikusan létrehozza a dalszöveget is, miközben a felhasználók beállíthatják a stílust, a tempót vagy akár a vokál jellegét.
A modell képekből és videókból is képes inspirációt meríteni: a Gemini a feltöltött vizuális tartalom hangulatához illő zenét és dalszöveget generál.
A rendszer jelenleg 30 másodperces zeneszámokat hoz létre, amelyekhez a Google Nano Banana AI készít borítóképet. A dalok könnyen megoszthatók vagy letölthetők az alkalmazásból.
A Google szerint a funkció célja nem feltétlenül professzionális zeneszámok létrehozása, hanem egy kreatív, játékos önkifejezési eszköz biztosítása a felhasználók számára.
Terjeszkedik a YouTube-on is
A Lyria 3 egy másik Google-termékben, a YouTube Dream Track eszközben is megjelenik, amely lehetővé teszi a YouTube-alkotók számára, hogy AI által generált zenét készítsenek Shorts videóikhoz. A funkció korábban csak az Egyesült Államokban volt elérhető, most azonban további piacokra is kiterjesztik.
Jogkezelés és védelem
A generatív zene térnyerésével együtt természetesen szerzői jogi kérdések is felmerülnek. A Google szerint a Lyria 3 tréningje olyan zenéken alapul, amelyek használatára a vállalat jogosult a partneri megállapodások, szolgáltatási feltételek és a vonatkozó jogszabályok alapján.
A rendszer több védelmi mechanizmussal is rendelkezik: a generált zenék nem utánozhatnak konkrét előadókat, a tartalmakat szűrők ellenőrzik, és minden zeneszám SynthID vízjelet kap, amely segít az AI által generált tartalmak azonosításában.
A Lyria 3 integrációja jól mutatja, hogy a nagy technológiai cégek egyre erősebben pozicionálják magukat a generatív zene területén – miközben a zeneipar számára továbbra is kulcskérdés marad, hogyan kezelik a modellek tréningadatait és a szerzői jogokat.
Források:
Fotó: Google




