A TikTok anyavállalata, a ByteDance két különálló tanulmányt is publikált az elmúlt hónapokban, ami jól tükrözi a cég kiterjedt munkáját a zene generálás területén.
Az MBW két friss tudományos cikket tárt fel, amelyek azt mutatják, hogy a ByteDance ambíciói a mesterséges intelligencia által készített zene területén sokkal kiterjedtebbek, mint amit eddig láttunk. Emellett pedig két szabadalmi bejelentést is kiszúrtak az újságírók.
A ByteDance kutatói azt állítják az első tanulmányban „az eredményül kapott modell eléri a legkorszerűbb mesterséges intelligencia modellek hangminőségét”. Ezt az AI algoritmust 545 órányi zene segítségével tanították be, az elkészült demókat pedig meg is lehet hallgatni.
A második tanulmány modelljét 257 000 órányi zenei adaton képezték ki, amelyet a kutatók úgy szűrtek ki, hogy az instrumentális zenére összpontosítson. A modell támogatja a zenés és a szöveges promptolást is. A generált zenei példák meghallgathatók itt.
A szabadalmakban kiemeli a ByteDance, hogy „a struktúra az emberek által komponált zene egyik legfontosabb aspektusa, amely döntő szerepet játszik abban, hogy egy zenemű átfogó koherencia és szándékosság érzetét keltse.” Illetve, hogy „ez a technológia fejlett zeneelméleten alapul, és újszerű módon kombinálja a neurális hálózatokat, hogy másodpercek alatt egyedi, professzionális minőségű zenét állítson elő.”
Az MBW már egy ideje foglalkozik azzal a feltételezett lehetőséggel, hogy a TikTok és más szolgáltatások mesterséges intelligenciával készített zenékkel töltik meg katalógusaikat – felhígítva ezzel a hagyományos jogtulajdonosok piaci részesedését.
Viszont jelenleg még nem egyértelmű, hogy ezeket a technológiai megoldásokat hogyan fogja hasznosítani a TikTok.




