13.2 C
İstanbul

Meta metin, resim ve ses için yeni AI modellerini yayınladı

Meta'nın Temel Yapay Zeka Araştırması (FAIR) ekibi, çok modlu metin ve görüntüleri işleyebilen ve oluşturabilen Chameleon, çok belirteçli bir tahmin modeli ve metinden müziğe model olan JASCO dahil olmak üzere yeni modeller yayınladı.

Mutlaka Okumalısın

Meta’nın Temel Yapay Zeka Araştırması (FAIR – Fundamental AI Research) ekibi, görüntüden metne, metinden müziğe, çoklu belirteç tahmini ve yapay zeka tarafından oluşturulan konuşmaya filigran ekleme tekniği dahil olmak üzere yeni modelleri açıkladı.

Meta, en yeni AI modellerinden bazılarını yayınladı. Bunlar arasında, hem görüntüleri hem de metni işleyebilen ve oluşturabilen çok modlu bir model olan Chameleon, daha verimli dil eğitimi için çok belirteçli bir tahmin modeli ve metinden ve akorlar veya vuruşlar gibi diğer girdilerden müzik oluşturmaya yönelik bir model olan JASCO yer alıyor.

Bukalemun Mayıs ayında sunuldu. Genellikle tek modlu sonuçlar üreten çoğu büyük dil modelinin aksine, çok modlu Chameleon, herhangi bir metin ve resim kombinasyonunu girdi olarak işleyebilir ve ayrıca herhangi bir metin ve resim kombinasyonunu çıktı olarak işleyebilir. Meta, 7B ve 34B varyantlarını yalnızca araştırma amacıyla ticari olmayan bir lisans altında yayınlar.

Chameleon’dan kısa bir süre önce Meta, daha iyi ve daha hızlı büyük dil modelleri geliştirmeye yönelik yeni bir yaklaşım da gösterdi: çoklu belirteçli tahmin . Ekip, yapay zeka dil modellerini eğitirken çoklu belirteçli tahminin performansı, tutarlılığı ve akıl yürütme yeteneğini geliştirdiğini göstermeyi başardı. Meta, ticari olmayan bir lisans altında kod tamamlama için önceden eğitilmiş modelleri yalnızca araştırma amacıyla yayınlıyor.

Meta, AI konuşması için ses modelini ve filigranı yayınladı

Şirket ayrıca metinden müziğe model JASCO’yu da yayınlıyor. Metnin yanı sıra, oluşturulan müzik çıkışı üzerindeki kontrolü geliştirmek için akorlar veya vuruşlar gibi çeşitli girişleri de kabul eder.

AudioSeal ile Meta, yapay zeka tarafından oluşturulan konuşmayı daha uzun ses segmentlerinde bile tanıyabilen ve işaretleyebilen bir ses filigranı teknolojisi sunuyor. Yöntemin diğer yöntemlerden farklı olarak 485 kata kadar daha hızlı olduğu söyleniyor. AudioSeal ticari bir lisans altında yayınlanmaktadır.

İLGİLİ YAZI :   Google Bard, ChatGPT ile rekabet etmek için Imagen 2 tabanlı ücretsiz görsel oluşturucuya kavuşuyor

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler