14.3 C
İstanbul

OpenAI yapay zekasının bir sesi klonlaması için 15 saniye yetiyor

OpenAI, kısa süre önce kendi ses klonlama teknolojisinin birinin sesini yeniden üretmek için sadece 15 saniyelik ses materyali gerektirdiğini açıkladı.

Mutlaka Okumalısın

Son yıllarda, bir yapay zeka parçasının birinin sesini klonlamak için ihtiyaç duyduğu dinleme süresi giderek kısalıyor. Eskiden dakikalardı, şimdi sadece saniyeler.

Viral yapay zeka sohbet robotu ChatGPT’nin arkasındaki Microsoft destekli şirket OpenAI, kısa süre önce kendi ses klonlama teknolojisinin birinin sesini yeniden üretmek için sadece 15 saniyelik ses materyali gerektirdiğini açıkladı.

OpenAI, web sitesindeki bir gönderide, 2022’nin sonlarından bu yana geliştirmekte olduğu Voice Engine adlı modelin küçük ölçekli bir önizlemesini paylaştı.

Voice Engine, en az 15 saniyelik sözlü materyalle beslenerek çalışıyor. Kullanıcı daha sonra OpenAI’nin “orijinal konuşmacıya yakından benzeyen”, “duygusal ve gerçekçi” konuşma olarak tanımladığı metni oluşturmak için metin girebiliyor.

OpenAI, “sentetik sesin kötüye kullanılma potansiyeli nedeniyle daha geniş bir sürüm için temkinli ve bilinçli bir yaklaşım” benimsediğinde ısrar ediyor ve “sentetik seslerin sorumlu bir şekilde konuşlandırılması ve toplumun bu yeni yeteneklere nasıl uyum sağlayabileceği konusunda bir diyalog başlatmak” istediğini ekleyerek şunları kaydediyor:

“Bu konuşmalara ve küçük ölçekli testlerin sonuçlarına dayanarak, bu teknolojinin geniş ölçekte kullanılıp kullanılmayacağı ve nasıl kullanılacağı konusunda daha bilinçli bir karar vereceğiz.”

OpenAI’nin atıfta bulunduğu kötüye kullanımlardan biri, bazı suçluların bir süredir kamuya açık olan benzer teknolojiyi kullanarak halihazırda gerçekleştirdikleri bir dolandırıcılık. Bu yöntemde bir ses klonlanıyor ve daha sonra bu kişinin bir arkadaşı ya da akrabası aranarak banka havalesi yoluyla nakit para vermesi için kandırılıyor. Bu tür bir teknolojinin yaklaşan başkanlık seçimlerinde nasıl kullanılabileceğine dair korkular da var.

ABD Başkanı Joe Biden’ın sesinin bir klonunun kullanıldığı bir robocall’un insanlara Ocak ayındaki New Hampshire ön seçimlerinde oy kullanmamalarını söylediği yakın tarihli yüksek profilli bir olayla ilgili dikkat çekilen bir konu.

İLGİLİ YAZI :   AMD, daha hızlı yapay zeka eğitimi için yeni çipler çıkarıyor

Bir başka endişe de hızla gelişen teknolojinin, yapay zekanın sentetik bir versiyon yaratmak için kullanılabilmesi için seslerinin haklarını devretmelerinin giderek daha fazla isteneceğinden korkan seslendirme sanatçılarının geçim kaynaklarını nasıl etkileyeceği ve böyle bir sözleşme için ödenecek ücretin, aktörden işi bizzat yapmasının istenmesinden çok daha düşük olacağı.

Teknolojinin daha olumlu uygulamalarına bakıldığında OpenAI, “önceden ayarlanmış seslerle mümkün olandan daha geniş bir konuşmacı yelpazesini temsil eden” doğal, duygusal sesler kullanarak okuyamayanlara ve çocuklara okuma yardımı sağlamanın yanı sıra Spotify’ın halihazırda denemekte olduğu videoların ve podcast’lerin anında çevrilmesi için kullanılabileceğini öne sürüyor.

Ayrıca, hastalık nedeniyle sesini yavaş yavaş kaybeden hastaların kendi seslerine benzeyen bir ses kullanarak iletişim kurmaya devam etmelerine yardımcı olmak için de kullanılabilir.

OpenAI’nin web sitesinde yapay zeka tarafından üretilen ses ve referans sesten bazı örnekler var ve bunların oldukça olağanüstü olduğunu kabul edeceğinizden eminiz.


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler