İngiliz startup Wayve, video verilerinden dinamik sahnelerin gerçekçi bir şekilde yeniden yapılandırılmasına yönelik yeni bir yapay zeka modeli olan PRISM-1’i tanıttı. Şirket, otonom sürüş simülasyonunu yeni bir seviyeye taşımayı hedefliyor.
Londra merkezli startup Wayve, araç kamera videolarını kullanarak üç boyutlu sokak manzaralarını zamanın dördüncü boyutuyla yeniden oluşturabilen “PRISM-1” adlı bir yapay zeka modeli geliştirdi. Şirket, NeRF’leri ve Gauss sıçramasını mümkün kılan sinirsel temsillere benzer teknolojiler kullanıyor.
Teknoloji, trafik senaryolarının daha ayrıntılı ve gerçekçi simülasyonlarını mümkün kılmayı amaçlayarak Wayve’in yapay zeka modellerini otonom sürüş için daha hızlı eğitmesine ve test etmesine olanak tanıyor.
PRISM-1’in temelinde yayalar, bisikletliler ve diğer araçlar gibi birçok hareketli unsurun bulunduğu karmaşık kentsel sahneleri bile yakalayabilen esnek bir yöntem yer alıyor. Buna yanıp sönen trafik ışıkları, fren lambaları, arabalardaki sinyal lambaları ve ön cam silecekleri de dahildir.
Kendi kendine giden arabalara yönelik önceki simülasyonlar burada sınırlamalarla karşı karşıyaydı çünkü tüm dinamik etkileşimleri ve aydınlatma koşullarını bir 3D modelde haritalamak çok zaman alıcıydı.
PRISM-1 statik ve dinamik unsurları öğrenir
PRISM-1, manuel açıklamalar veya önceden tanımlanmış modeller olmadan, kendi kendini denetleyen bir şekilde videolardaki statik öğeleri dinamik öğelerden ayırmayı öğrenir. Wayve’e göre bu, çok fazla çaba tasarrufu sağlıyor.
Sistem daha sonra sahnedeki hareketleri dolaylı olarak takip ediyor ve bunları 3 boyutlu geometriyle eşleştiriyor. Kesin bir anlayış için derinlik, yüzey normalleri, optik akış ve semantik segmentasyon, yani görüntü noktalarının nesne sınıflarına atanması hakkındaki bilgiler dahil edilmiştir.
Bu, görsel akıl yürütme tekniklerine, yani görüntülerden mantıksal çıkarımlara dayanmaktadır. Açık 3D açıklamalara veya LIDAR gibi ek sensörlere gerek yoktur.
PRISM-1 alternatif sahnelerde de oynayabilir
Örnek videolar Londra ve Mountain View, Kaliforniya’dan yeniden inşa edilmiş sokak manzaralarını göstermektedir. PRISM-1, sahneyi farklı açılardan göstermek için kamerayı serbestçe kaydırabilir. Zaman atlamaları da mümkündür; örneğin, yayalar ve arabalar onun etrafında hareket ederken sabit bir araç.
Bu, orijinal olarak kaydedilen rotanın dışında kalan tehlikeli durumlarda sürüş modelinin davranışını test etmek için önemli. Wayve’e göre görüntü oluşturma, tüneldeki yansımalar gibi zorlu aydınlatma koşullarında bile stabil kalıyor.
Yeniden yapılanmalar, saf kamera görüntüsüne ek olarak, hareketli nesnelerin derinlik haritalarını ve hız vektörlerini de gösteriyor. Alternatif senaryolar aracılığıyla yayalar gibi bireysel unsurların hedefli olarak kaldırılması da mümkün.
“Hayalet Spor Salonu”nda PRISM-1 ile eğitilecek otonom arabalar
Wayve, PRISM-1’i şirketin Aralık 2023’te tanıttığı sürüş simülatörü “Ghost Gym”e entegre etmeyi planlıyor. Daha gerçekçi ortamların, sürüş modellerinin eğitimini ve değerlendirilmesini hızlandırması bekleniyor.
Wayve, geliştirilmiş simülatörün yapay zekası için daha hızlı geliştirme döngüleri sağlamasını bekliyor. Şirket aynı zamanda modelleri nadir hava koşullarında veya yeni bölgelerde sürüş gibi yeterince temsil edilmeyen senaryolara uyarlamak istiyor. Sürüş davranışının diğer araç türlerinde veya diğer kameralarla verimli bir şekilde test edilmesi de kolaylaşacak.
Wayve, PRISM-1 üzerindeki çalışması sırasında “WayveScenes101” referans veri setini oluşturup yayınladı. Birleşik Krallık ve ABD’deki karmaşık, dinamik unsurlara sahip örnek yol sahneleri içeriyor.
Şirket, PRISM-1’e ek olarak daha önce metin, resim, video ve eylem verilerinden çeşitli trafik durumlarının sentetik videolarını üreten üretken bir yapay zeka modeli olan GAIA-1’i de tanıtmıştı. Lingo-1 ve Lingo-2 ile aynı zamanda kararları açıklamak için makine görüşünü metin tabanlı mantıkla birleştiren çok modlu dil modelleri de geliştiriyor.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.