Çok modlu anlayışı ve görsel üretimi bir araya getiren araç: Janus

Araştırmacılar, hem görüntüleri anlamada hem de oluşturmada en iyi performansı gösteren yeni bir yapay zeka modeli olan Janus’u sundu.

Bir araştırma ekibi, çok modlu anlayışı ve görsel üretimi tek bir sistemde birleştiren yenilikçi bir AI modeli olan Janus’u geliştirdi. Geliştiricilere göre Janus, görsel bilgileri işlemeye yönelik yeni bir yaklaşıma dayanan esnekliği ve performansıyla öne çıkıyor.

Janus’un temel özelliği, kavrama ve üretim görevleri için görsel kodlamanın ayrıştırılmasıdır. Janus’un mimarisi, otoregresif bir dönüştürücü modele dayanmaktadır. Ancak, karşılaştırılabilir modellerin aksine, Janus metin, kavrama için görüntüler ve üretim için görüntüler gibi farklı giriş türleri için ayrı kodlayıcılar kullanır. Bu kodlayıcılar, ham verileri daha sonra dönüştürücü tarafından işlenen özelliklere dönüştürüyor.

Araştırmacılara göre Janus, aynı boyuttaki modellerle karşılaştırıldığında çok modlu anlama ve görsel oluşturma için çeşitli ölçütlerde en iyi sonuçları elde ediyor. Çok modlu anlama görevlerinde Janus, yalnızca 1,3 milyar parametreyle önemli ölçüde daha fazla parametreye sahip bazı göreve özgü modellerden bile daha iyi performans gösteriyor.

SDXL, LlamaGen ve Janus tarafından oluşturulan, çeşitli stil ve yorumlarla simge yapıları ve hayvanları tasvir eden yapay zeka destekli görüntüler.

Janus ayrıca görsel üretimde güçlü bir performans gösteriyor ve DALL-E 2 gibi bazı iyi bilinen modellerden daha iyi performans gösteriyor. Sonuçlar kalite açısından FLUX gibi mevcut en iyi modellerin çok gerisinde kalsa da, model önemli ölçüde daha küçüktür ve daha fazla ölçekleme daha iyi sonuçlar sağlamalıdır.

Esneklik temel bir özelliktir

Geliştiricilere göre, Janus’un özel bir avantajı esnekliği ve genişleme kolaylığıdır. Görsel kodlamayı ayırarak, uzlaşmaya varmadan anlama ve üretim görevleri için en uygun kodlayıcılar seçilebilir.

Model ayrıca 3B nokta bulutları, dokunsal veriler veya EEG sinyalleri gibi ek modaliteleri içerecek şekilde kolayca genişletilebilir. Araştırmacılar, bunun Janus’a daha da güçlü bir çok modlu genelci model olma potansiyeli verdiğini açıklıyor.

İLGİLİ YAZI : Teknoloji çalışanlarının yarısından fazlası yapay zekanın abartıldığını düşünüyor

Geliştiricilere göre, güçlü performans, yüksek esneklik ve genişletilebilirliğin birleşimi, Janus’u gelecek nesil birleşik çok modlu modeller için umut vadeden bir aday haline getiriyor.

Daha fazla bilgi ve model GitHub’da bulunabilir.

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

Janus, yenilikçi mimari aracılığıyla çok modlu anlayışı ve görsel üretimi bir araya getiriyor

Mutlaka Okumalısın

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

Esneklik temel bir özelliktir

Daha Fazla

CEVAP VER İptal

Son Haberler

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

KLING AI video oluşturucusu kullanıcıların kendi AI video karakterlerini eğitmelerine olanak tanıyor

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor