Synthesia'dan insan benzeri avatarlar: Expressive Avatars

Yapay zeka (YZ) video üreticileri ve yarattıkları avatarlar hızla gelişiyor ve İngiltere merkezli YZ video şirketi Synthesia, gelişmekte olan teknolojiyi bir sonraki aşamaya taşımayı hedefliyor.

Şirket, bir dizi gerçekçi insan duygusunu tasvir edebilen Expressive Avatarlarını duyurdu. Şirketin “dijital aktörler” olarak adlandırdığı en son sürüm olan Expressive Avatars, gelişmiş yüz ifadeleri, daha doğru dudak senkronizasyonu ve gerçekçi insan benzeri seslere sahip; çoğu metinden sese yapay zekanın robotik tonuna göre bir yükseltme sağlıyor.

Şirketten yapılan açıklamada, “Bu teknoloji, dijital avatarlara sanal ile gerçek arasındaki çizgiyi bulanıklaştıran bir gelişmişlik ve gerçekçilik düzeyi getiriyor” denildi.

Synthesia’nın metinden videoya platformu, kullanıcıların seçebileceği 160’tan fazla stok yapay zeka avatarı ile birlikte geliyor ve şirket bu avatarları insan aktörlere dayanarak, onların rızası ve telif haklarıyla oluşturdu. Ekipler videolar üzerinde uçtan uca işbirliği yapabiliyor ve 130’dan fazla dilde video oluşturabiliyor.

CEO Victor Riparbelli, tanıtım sırasında yaptığı açıklamada, şirketin tüm video üretim sürecini yazılımlarıyla değiştirmeyi hedeflediğini, ancak Hollywood için gelmediklerini söyledi. Bunun yerine şirket, oluşturulması kolay, ilgi çekici ve insan benzeri videolara ihtiyaç duyan kurumsal ve B2B içeriklere odaklanıyor.

Synthesia’nın Etkileyici Avatarları, Express-1 YZ modeli tarafından destekleniyor. Şirket, ürünün metin öğeleri için açık kaynaklı LLM’ler kullanırken, Express-1 tamamen Synthesia’nın kendi bünyesinde ürettiği içerik üzerinde eğitildi; sentetik veya web’den kazınmış hiçbir şey yok.

Demoda Riparbelli, şirketin Express-1 modeli için Londra ve New York stüdyolarında video kaydetmek üzere binlerce aktör kiraladığını ve bunun kısmen mevcut veri kümelerine gömülü önyargıları içe aktarmaktan kaçınmak için olduğunu açıkladı.

Riparbelli, “Bu özel teknolojiyle, sentetik içeriğe yönelmek uygun bir strateji değil, çünkü esasen sentetik içeriği kopyalayabiliyorsunuz, bu da tam olarak bununla yapmamaya çalıştığımız şey. İnsanların gerçekte nasıl konuştuğunu kopyalamaya çalışıyorsunuz” dedi.

İLGİLİ YAZI : IBM: Üretken yapay zeka işleri otomatikleştirebilir

Riparbelli, bu nispeten daha küçük veri setinin Express-1 modeli için yeterli olduğunu çünkü OpenAI’nin Sora veya Runway gibi modellerinden çok daha “dar ve spesifik” olduğunu ekledi.

Demoda üç ipucu gösteren bir avatar gösteriliyor: “Mutluyum”, “Üzgünüm” ve “Hayal kırıklığına uğradım”. Avatar, Synthesia’nın önceki nesil teknolojilerine göre daha gerçekçi ve doğal bir ritimle konuşuyor.

Duyuruda “Etkileyici Avatarlar sadece insan konuşmasını taklit etmekle kalmıyor; bağlamını da anlıyor. Konuşma ister neşeli ister kasvetli olsun, avatarlarımız performanslarını buna göre ayarlıyor ve bir zamanlar yalnızca insan aktörlerin alanı olan bir empati ve anlayış düzeyi sergiliyorlar” deniliyor.

Gerçek insanlardan ayırt edilemese de, bu avatarların gerçeğe yakın doğası endişe verici olabilir; özellikle de deepfake teknolojisinin nasıl kötüye kullanıldığı göz önüne alındığında.

Şirket tarafından yapılan duyuruda, “İfade Edici Avatarların, dünya çapında milyarlarca insanın oy kullanma hakkını kullandığı, demokrasi için önemli bir yılda piyasaya sürülen güçlü ve yeni bir teknoloji olduğunun farkındayız” denildi ve şunlar kaydedildi:

“Platformumuzun kötüye kullanımını önlemek için, insanların oluşturabileceği içerik türünü kısıtlamak için politikalarımızı güncellemek, kötü niyetli aktörlerin erken tespitine yatırım yapmak, yapay zeka güvenliği üzerinde çalışan ekipleri artırmak ve C2PA gibi içerik kimlik bilgileri teknolojilerini denemek de dahil olmak üzere ek adımlar attık.”

Synthesia’nın web sitesine göre, kullanıcılar özel avatarlar oluşturabilir ancak kişinin açık rızasına sahip olmalı ve “kapsamlı KYC benzeri bir prosedürden” geçmeli. Ayrıca, istediğiniz zaman süreçten çıkabilirsiniz (stok aktörleri gibi) ve Synthesia verilerinizi ve benzerliğinizi silecek. Şirket, kullanıcıların hiçbir koşulda ünlülerin ya da politikacıların avatarlarını oluşturmalarına izin vermiyor.

Buna ek olarak Riparbelli bir videoda Synthesia’nın araçlarının yalnızca kurumsal planlara sahip haber kuruluşları tarafından haber içeriği oluşturmak için kullanılabileceğini açıklıyor. Ancak, Synthesia’nın hangi kriterleri kullandığı ve şirketin platformu tarafından oluşturulan içeriği kontrol edip etmediği belli değil.

İLGİLİ YAZI : StripedHyena: Yeni nesil üretken yapay zeka için yeni bir mimari mi?

Synthesia ayrıca, içerik kaynağı veya bir medya parçasının kökenini belirlemeye yönelik araçlar üzerinde çalışan şirket ve kuruluşlardan oluşan bir koalisyon olan Content Authenticity Initiative‘in bir parçası.

Synthesia, Etkileyici Avatarların, kurumların temel içerik ihtiyaçlarının ötesine geçerek daha empatik bir dokunuşa sahip videolar oluşturmalarına yardımcı olacağına inanıyor: Sağlık hizmetleri gibi hassas konularla ilgili olanlar veya gerçek bir insanın samimiyetini ve sabrını taklit eden müşteri destek materyalleri.

Riparbelli demo sırasında “Bu sadece ilk sürüm, bu modellerin üzerine inşa ettiğimiz ilk ürün diyebilirsiniz. Sanırım önümüzdeki altı ila dokuz ay içinde yeteneklerde büyük bir değişim bekliyoruz” dedi.

Kaynak: Radhika Rajkumar / ZDNet

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

Synthesia’dan insan benzeri avatarlar: Expressive Avatars

Mutlaka Okumalısın

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

Daha Fazla

CEVAP VER İptal

Son Haberler

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

KLING AI video oluşturucusu kullanıcıların kendi AI video karakterlerini eğitmelerine olanak tanıyor

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor