20.7 C
İstanbul

OpenAI, GPT-4’ü YouTube videosuyla gizlice eğitti

New York Times'ın haberine göre OpenAI, GPT-4 büyük dil modelini (LLM) bir milyon saatten fazla deşifre edilmiş YouTube videosuyla gizlice eğitti.

Mutlaka Okumalısın

Wall Street Journal’dan Joanna Stern, Mart ayında OpenAI CTO’su Mira Murati ile şirketin Sora adlı en yeni metinden video oluşturucusunu tartışmak üzere bir araya geldi.

Kısa sohbet sırasında Stern, Murati’ye Sora’nın YouTube, Instagram ve Facebook’taki videolar üzerinde eğitilip eğitilmediğini sordu; bu da uzun ve garip bir duraksamaya neden oldu.

Murati, “Kamuya açık verileri ve lisanslı verileri kullandık” dedi.

“Yani YouTube’daki videolar mı?” Stern karşılık verdi.

Murati, yüzünü buruşturarak “Aslında bundan emin değilim” diye cevap verdi.

Görünen o ki, CTO’nun bu sorudan rahatsız olmasının iyi bir nedeni var. New York Times’ın haberine göre OpenAI, GPT-4 büyük dil modelini (LLM) bir milyon saatten fazla deşifre edilmiş YouTube videosuyla gizlice eğitti.

YouTube videolarından ses ve transkripsiyonların kopyalanmasının tartışıldığı konuşmalar hakkında bilgi sahibi olan kaynaklar, gazeteye transkriptlerin GPT-4’e beslendiğini söyledi.

NYT’nin kaynaklarına göre sadece OpenAI değil, YouTube’un sahibi Google da kendi yapay zeka modellerini eğitmek için transkriptleri topladı.

Bu, yapay zeka şirketlerinin modellerini eğitmek için büyük miktarlarda karanlık ve muhtemelen telif haklarını ihlal eden verilere nasıl güvendiklerini gösteren bir başka veri noktasıdır – hepsi de hak sahiplerinin rızasını almak bir yana, adil bir şekilde tazmin edilmeden.

Bu uygulama halihazırda bir dizi davaya yol açmış durumda; hak sahipleri OpenAI ve Microsoft gibi şirketleri, uygulamalarını, ABD telif hakkı yasasının telif hakkıyla korunan materyallerin izin alınmaksızın sınırlı kullanımına izin veren bir doktrini olan “adil kullanım “a yanlış atfetmekle suçluyor.

İLGİLİ YAZI :   X, 'asi' sohbet robotu Grok'u abonelerine sunmaya başladı

NYT’nin kendisi bile OpenAI ve Microsoft’a karşı telif hakkı ihlali suçlamasıyla dava açtı.

Geçtiğimiz hafta, NYT’nin haberini yayınlamasından günler önce, YouTube CEO’su Neal Mohan Bloomberg’e açık bir mesaj göndererek OpenAI’nin Sora’yı YouTube videoları üzerinde eğitmiş olması halinde bunun video platformunun kullanım koşullarının “açık bir ihlali” olacağını söyledi.

Google sözcüsü Matt Bryant NYT’ye YouTube’un “YouTube içeriğinin izinsiz olarak kazınmasını ya da indirilmesini” yasakladığını söyledi.

Bryant ayrıca The Verge’e şirketin OpenAI’nin faaliyetlerine ilişkin “doğrulanmamış raporlar gördüğünü” söyledi.

Açık olmak gerekirse, Sora ve GPT-4’ün ne ölçüde bağlantılı olduğunu hala tam olarak bilmiyoruz. OpenAI’nin yaklaşan metinden videoya oluşturucusu için tekerleği yeniden icat etmediğini, metin istemlerini yorumlamak için LLM tarafından desteklenen bir çeviri katmanına güvendiğini biliyoruz.

Belki de asıl soru, bir milyon saatlik YouTube videosunu izinsiz kopyalamanın hırsızlık anlamına gelip gelmediğidir. ABD’deki telif hakkı yasası, özellikle adil kullanım söz konusu olduğunda, yasal bir gri alan olmaya devam ediyor.

Uzmanlar NYT’ye, yapay zeka şirketleri internetin tamamını taradıkça, tüm içeriğin lisanslanmasının muhtemelen imkansız olacağını söyledi.

Girişim sermayesi şirketi Andreessen Horowitz’i temsil eden avukat Sy Damle gazeteye verdiği demeçte, “İhtiyaç duyulan veri o kadar büyük ki, toplu lisanslama bile gerçekten işe yaramıyor” dedi.

Tüm hakları güvence altına almadan bile, yapay zeka şirketleri yakında daha da garip bir zorlukla karşı karşıya kalabilir: eğitim verilerinin tamamen tükenmesi.

Araştırmacılar, 2026 yılına kadar YZ şirketlerinin doymak bilmeyen modellerini besleyecek yüksek kaliteli verilerin tükenme ihtimalinin yüzde 90 olduğunu ortaya koydu. Başka bir deyişle, OpenAI gibi şirketler sonunda yapay zeka modellerini sentetik, yapay zeka tarafından üretilen çıktılar üzerinde eğitmeye başvurmak zorunda kalabilir – bu, telif hakkı ile ilgili davalardan çok daha feci sonuçlar doğurabilecek tehlikeli bir dibe doğru yarış.

İLGİLİ YAZI :   Microsoft Copilot Pro'yu duyurdu

Kaynak: Yahoo


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler