Meta yeni yapay zeka modeli V-JEPA'yı tanıttı

Meta, yeni bir yapay zeka modeli olan Video Joint Embedding Predictive Architecture’ı (V-JEPA) tanıttı. Bu model, Meta’nın yapay zekanın fiziksel dünyayı anlama ve onunla etkileşime girme becerisini geliştirmeyi amaçlayan genel JEPA mimarisi üzerine yaptığı araştırmanın bir parçası.

Meta’nın Başkan Yardımcısı ve Baş Yapay Zeka Bilimcisi Yann LeCun ve ekibi tarafından geliştirilen V-JEPA, tıpkı bir bebeğin nesnelerin düşüşünü izleyerek yer çekimini öğrenmesi gibi, videolardaki karmaşık etkileşimleri tahmin etmek ve anlamak için tasarlandı. Model, her bir pikseli yeniden yapılandırarak değil, Meta’nın görüntüleri zihnimizde nasıl işlediğimize benzediğini açıkladığı, sahnenin soyut bir temsilinin kodunu çözerek bir videonun eksik veya belirsiz kısımlarını doldurarak çalışıyor.

V-JEPA’nın arkasındaki fikir, tahminlerin daha üst düzey bir kavramsal alanda gerçekleşmesi gerektiği ve böylece alakasız ayrıntılara boğulmadan görevleri anlamak ve tamamlamak için önemli olan şeylere odaklanmasına izin vermesi. Örneğin, bir videodaki ağacı tanırken, modelin her bir yaprağın hareketini dikkate alması gerekmiyor.

Modelin eğitimi, bir videonun önemli bölümlerini gizleyen ve V-JEPA’yı uzayda ve zamanda neler olduğunu tahmin ederek sahnenin dinamiklerini öğrenmeye zorlayan bir maskeleme yöntemi içeriyor. Bu maskeleme rastgele değildir; modelin sadece basit tahminlerden öğrenmesini değil, nesnelerin nasıl etkileşime girdiğine dair bir anlayış geliştirmesini sağlamak için dikkatlice tasarlanmıştır. Model 2 milyon video ile eğitildi.

Modelin güçlü yönlerinden biri, çekirdek modeli yeniden eğitmeden yeni görevlere uyum sağlama yeteneği. Geleneksel olarak, yapay zeka modellerine ince ayar yapılması gerekir, bu da tüm mimarilerinin bir görev için özelleşeceği ve diğerleri için verimsiz hale geleceği anlamına geliyor. Öte yandan V-JEPA, bir kez önceden eğitilebilir ve ardından eylem sınıflandırması veya nesne etkileşimi algılama gibi farklı görevlere uyum sağlamak için göreve özgü küçük bir katman eklenebilir.

İLGİLİ YAZI : Samsung'un yapay zeka özellikli yeni akıllı buzdolabı beslenme ihtiyaçlarınıza göre tarifler tasarlayabiliyor

Geleceğe bakan Meta’nın ekibi, V-JEPA’nın yeteneklerini sese genişletme ve daha uzun zaman aralıklarında planlama ve tahmin etme yeteneğini geliştirme konusunda potansiyel görüyor. Şu anda kısa vadeli eylem tanımada başarılı olsa da, daha uzun vadeli tahmin daha fazla araştırma için bir ilgi alanı.

LeCun’un JEPA’sının daha geniş hedefleri var

LeCun, karmaşık verilerden öğrenme ve farklı soyutlama seviyelerinde tahminler yapma zorluğunu ele almak için 2022’de JEPA mimarisini tanıttı. Ekibi 2023 yılında, minimum etiketli veriyle ImageNet üzerinde etkileyici bir performans sergileyen ilk model olan I-JEPA’yı tanıttı.

Joint Embedding Predictive Architecture (JEPA), mevcut yeteneklerinin ötesinde, otonom yapay zekayı destekleyebilecek kapsamlı dünya modellerini mümkün kılmak için daha geniş hedeflere sahip. LeCun, alt düzey tahminlerin üst düzey soyutlamalarını oluşturmak için JEPA modellerinin hiyerarşik olarak istiflenmesini öngörüyor. Nihai hedef, bu modellerin gelecekteki olaylar hakkında uzamsal ve zamansal tahminlerde bulunması ve video eğitiminin denklemde önemli bir rol oynaması.

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.

Meta yeni yapay zeka modeli V-JEPA’yı tanıttı

Mutlaka Okumalısın

Cohere, 5,5 milyar dolarlık değerlemeyle 500 milyon dolar topladı

Çinli şirketler ölen sevdiklerini yapay zeka avatarlarıyla ‘diriltmeyi’ teklif ediyor

Streetscapes AI, sıfırdan tüm şehirlerin inanılmaz derecede gerçekçi Sokak Görünümü sahnelerini oluşturuyor

‘Yapay zeka arama motorları demokrasiye geri dönülemez şekilde zarar verebilir’

LeCun’un JEPA’sının daha geniş hedefleri var

Daha Fazla

CEVAP VER İptal

Son Haberler

Cohere, 5,5 milyar dolarlık değerlemeyle 500 milyon dolar topladı

Çinli şirketler ölen sevdiklerini yapay zeka avatarlarıyla ‘diriltmeyi’ teklif ediyor

Streetscapes AI, sıfırdan tüm şehirlerin inanılmaz derecede gerçekçi Sokak Görünümü sahnelerini oluşturuyor

‘Yapay zeka arama motorları demokrasiye geri dönülemez şekilde zarar verebilir’

Mistral, matematik, kod ve genel görevler için üç yeni LLM programı yayınladı

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Cohere, 5,5 milyar dolarlık değerlemeyle 500 milyon dolar topladı

Çinli şirketler ölen sevdiklerini yapay zeka avatarlarıyla ‘diriltmeyi’ teklif ediyor