Londra Queen Mary Üniversitesi, Sony AI ve MBZUAI’nin Music X Lab’ındaki araştırmacılar, metin istemlerine göre mevcut müziği değiştirebilen Instruct-MusicGen adlı bir yapay zeka sistemi geliştirdiler.
The Decoder’ın haberine göre, Instruct-MusicGen, ekibin metinden müziğe düzenleme görevleri için geliştirdiği Meta’nın açık kaynaklı AI modeli MusicGen’i temel alıyor. Araştırmacılar, metin ve ses birleştirme modülleri ekleyerek orijinal MusicGen mimarisini değiştirdiler ve modelin düzenleme istemlerini ve ses girişini aynı anda işlemesine olanak sağladılar.
Eklenen ses ve metin birleştirme modülleri, kök olarak bilinen müzik parçalarını ekleme, kaldırma veya ayırma gibi hassas düzenleme görevlerini etkinleştiriyor. Kökler, genellikle enstrüman türüne göre düzenlenen ve müzik prodüksiyonunda önemli bir rol oynayan gruplanmış parçalar.
Bas olmadan ses girişi:
“Bas ekle” talimatıyla:
Giriş Sesi:
Giriş Sesi “sadece davullar”:
Araştırmacılar, Instruct-MusicGen’in metinden müziğe dönüştürme işleminin verimliliğini artırdığını ve müzik prodüksiyon ortamlarında dil modellerinin kullanımını genişlettiğini belirtiyor.
Yeni model, iyi sonuçlar elde etmek için yalnızca %8 daha fazla parametre ve 5.000 ek eğitim adımı, yani MusicGen’in toplam eğitim süresinin %1’inden daha azına ihtiyaç duyuyor. Geliştiriciler proje sayfasında çok sayıda örnek, kod, model ve ağırlık sağlıyor.
Sony, lisanslama konusunda net olmalı çünkü Meta, MusicGen’in yalnızca lisanslı müzikle eğitildiğini ve araştırma ekibinin kendi talimat ayarlaması için sentetik olarak oluşturulmuş müzik parçalarının bir veri kümesi olan Slakh210’u kullandığını iddia ediyor. Bu önemli çünkü Sony, metin istemlerine dayalı tamamen orijinal müzik besteleri üretebilen mevcut müzik üreticilerine karşı lisans ihlali iddiasında bulunan bir davada kilit bir oyuncu.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.