Meta, Aria gözlükleri kullanılarak kaydedilen iki taraflı konuşmaları içeren MMCSG (Akıllı Gözlüklerde Çok Modlu Konuşmalar) veri setini yayınladı.
Veri kümesi çok kanallı ses, video, ivmeölçer ve jiroskop verilerini içeriyor ve otomatik konuşma tanıma, etkinlik algılama ve konuşmacı günlüğü oluşturma gibi alanlardaki araştırmaları desteklemeyi amaçlıyor.
Gözlükler, atalet ölçüm birimi (IMU) ölçümlerinin yanı sıra yedi mikrofonla video ve ses yakalamaktadır. Tüm veriler izin veren katılımcılardan toplanmış ve gizliliği sağlamak için anonimleştirilmiştir.
MMCSG veri seti, gerçek zamanlı dil çevirisi gibi uygulamalar için potansiyel olarak kullanılabilir. İlgili araştırma makalesinde daha fazla bilgi bulunabilir ve veri seti Meta Veri Lisansı altında indirilebilir.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.