15 C
İstanbul

Janus, yenilikçi mimari aracılığıyla çok modlu anlayışı ve görsel üretimi bir araya getiriyor

Araştırmacılar, Janus ile birlikte çok modlu anlayışı ve görsel üretimi tek bir sistemde birleştiren bir AI modeli geliştirdiler. Metin ve resim gibi farklı girdi türleri için ayrı kodlayıcılar kullanıyor.

Mutlaka Okumalısın

Araştırmacılar, hem görüntüleri anlamada hem de oluşturmada en iyi performansı gösteren yeni bir yapay zeka modeli olan Janus’u sundu.

Bir araştırma ekibi, çok modlu anlayışı ve görsel üretimi tek bir sistemde birleştiren yenilikçi bir AI modeli olan Janus’u geliştirdi. Geliştiricilere göre Janus, görsel bilgileri işlemeye yönelik yeni bir yaklaşıma dayanan esnekliği ve performansıyla öne çıkıyor.

Janus’un temel özelliği, kavrama ve üretim görevleri için görsel kodlamanın ayrıştırılmasıdır. Janus’un mimarisi, otoregresif bir dönüştürücü modele dayanmaktadır. Ancak, karşılaştırılabilir modellerin aksine, Janus metin, kavrama için görüntüler ve üretim için görüntüler gibi farklı giriş türleri için ayrı kodlayıcılar kullanır. Bu kodlayıcılar, ham verileri daha sonra dönüştürücü tarafından işlenen özelliklere dönüştürüyor.

Araştırmacılara göre Janus, aynı boyuttaki modellerle karşılaştırıldığında çok modlu anlama ve görsel oluşturma için çeşitli ölçütlerde en iyi sonuçları elde ediyor. Çok modlu anlama görevlerinde Janus, yalnızca 1,3 milyar parametreyle önemli ölçüde daha fazla parametreye sahip bazı göreve özgü modellerden bile daha iyi performans gösteriyor.

SDXL, LlamaGen ve Janus tarafından oluşturulan, çeşitli stil ve yorumlarla simge yapıları ve hayvanları tasvir eden yapay zeka destekli görüntüler.

Janus ayrıca görsel üretimde güçlü bir performans gösteriyor ve DALL-E 2 gibi bazı iyi bilinen modellerden daha iyi performans gösteriyor. Sonuçlar kalite açısından FLUX gibi mevcut en iyi modellerin çok gerisinde kalsa da, model önemli ölçüde daha küçüktür ve daha fazla ölçekleme daha iyi sonuçlar sağlamalıdır.

Esneklik temel bir özelliktir

Geliştiricilere göre, Janus’un özel bir avantajı esnekliği ve genişleme kolaylığıdır. Görsel kodlamayı ayırarak, uzlaşmaya varmadan anlama ve üretim görevleri için en uygun kodlayıcılar seçilebilir.

Model ayrıca 3B nokta bulutları, dokunsal veriler veya EEG sinyalleri gibi ek modaliteleri içerecek şekilde kolayca genişletilebilir. Araştırmacılar, bunun Janus’a daha da güçlü bir çok modlu genelci model olma potansiyeli verdiğini açıklıyor.

İLGİLİ YAZI :   Açık kaynaklı PixArt-δ görüntü oluşturucu 0,5 saniyede yüksek çözünürlüklü yapay zeka görüntüleri üretiyor

Geliştiricilere göre, güçlü performans, yüksek esneklik ve genişletilebilirliğin birleşimi, Janus’u gelecek nesil birleşik çok modlu modeller için umut vadeden bir aday haline getiriyor.

Daha fazla bilgi ve model GitHub’da bulunabilir.


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler