Hatperces AI-dalokat ígér a Stable Audio 3.0 – teljesen licencelt tréningadattal
Írta: Ostroml
A Stability AI bemutatta a Stable Audio 3.0 rendszert, amely több mint hatperces zenék generálására képes, és a cég szerint kizárólag engedélyezett hanganyagokon tanították.
A Stability AI hivatalosan is elindította a Stable Audio 3.0 új generációját.
A friss modellcsalád négy különböző AI-rendszert tartalmaz, amelyek közül három open-weight formában érhető el — vagyis a súlyok szabadon letölthetők és továbbfejleszthetők.
A legnagyobb ugrás a zenék hosszában történt:
míg a korábbi Stable Audio 2.0 nagyjából háromperces anyagokat tudott létrehozni, a 3.0 Medium és Large modellek már teljes, hat percnél hosszabb struktúrájú kompozíciókat generálnak.
míg a korábbi Stable Audio 2.0 nagyjából háromperces anyagokat tudott létrehozni, a 3.0 Medium és Large modellek már teljes, hat percnél hosszabb struktúrájú kompozíciókat generálnak.
A főbb modellek
- Stable Audio 3.0 Small
- legfeljebb kétperces zenék
- offline, eszközön futó generálás
- a cég szerint ez az első olyan lokálisan futó modell, amely teljes számokat tud készíteni
- Stable Audio 3.0 Medium
- hosszabb, teljes szerkezetű kompozíciók
- Stable Audio 3.0 Large
- hat perc feletti generatív zenék
- fejlettebb szerkezeti és hangszerelési képességek
A Stability AI hangsúlyozta, hogy a modellek tréningje teljes egészében licencelt vagy nyílt felhasználású adatokon történt.
A tanítóadatok között szerepel:
- az AudioSparx több mint 800 ezer hangfájlja
- valamint a Freesound Creative Commons könyvtára
A vállalat szerint a cél egy olyan közösségi innovációs modell létrehozása, amely hasonló lehet ahhoz, amit a Stable Diffusion jelentett a vizuális AI-területen.
A Stability AI külön kiemelte:
az alkotók saját generált zenéik teljes tulajdonjogát megtartják, és azokat kereskedelmi célra is használhatják.
az alkotók saját generált zenéik teljes tulajdonjogát megtartják, és azokat kereskedelmi célra is használhatják.
Ugyanakkor az évi 1 millió dollár feletti bevétellel rendelkező cégek számára enterprise licenc szükséges a kereskedelmi felhasználáshoz.
A vállalat szerint ez a modell egyik legfontosabb megkülönböztető eleme:
állításuk alapján sok más nyílt AI-zenei rendszer továbbra is jogilag bizonytalan, engedély nélküli zenéken tréningezett adathalmazokra épül.
állításuk alapján sok más nyílt AI-zenei rendszer továbbra is jogilag bizonytalan, engedély nélküli zenéken tréningezett adathalmazokra épül.
HOZZÁSZÓLÁSOK
A hozzászóláshoz be kell jelentkezned.
LoginOLVASD EL EZEKET IS: