OpenAI, GPT-4'ü YouTube videosuyla gizlice eğitti

Wall Street Journal’dan Joanna Stern, Mart ayında OpenAI CTO’su Mira Murati ile şirketin Sora adlı en yeni metinden video oluşturucusunu tartışmak üzere bir araya geldi.

Kısa sohbet sırasında Stern, Murati’ye Sora’nın YouTube, Instagram ve Facebook’taki videolar üzerinde eğitilip eğitilmediğini sordu; bu da uzun ve garip bir duraksamaya neden oldu.

Murati, “Kamuya açık verileri ve lisanslı verileri kullandık” dedi.

“Yani YouTube’daki videolar mı?” Stern karşılık verdi.

Murati, yüzünü buruşturarak “Aslında bundan emin değilim” diye cevap verdi.

If you’re a tech executive the minimum you need is a good poker face when you’re asked a question like “Is your model trained on YouTube data?” https://t.co/UQvS5VXuRQ pic.twitter.com/l6USDILWN8

— Chris Stokel-Walker (@stokel) March 14, 2024

Görünen o ki, CTO’nun bu sorudan rahatsız olmasının iyi bir nedeni var. New York Times’ın haberine göre OpenAI, GPT-4 büyük dil modelini (LLM) bir milyon saatten fazla deşifre edilmiş YouTube videosuyla gizlice eğitti.

YouTube videolarından ses ve transkripsiyonların kopyalanmasının tartışıldığı konuşmalar hakkında bilgi sahibi olan kaynaklar, gazeteye transkriptlerin GPT-4’e beslendiğini söyledi.

NYT’nin kaynaklarına göre sadece OpenAI değil, YouTube’un sahibi Google da kendi yapay zeka modellerini eğitmek için transkriptleri topladı.

Bu, yapay zeka şirketlerinin modellerini eğitmek için büyük miktarlarda karanlık ve muhtemelen telif haklarını ihlal eden verilere nasıl güvendiklerini gösteren bir başka veri noktasıdır – hepsi de hak sahiplerinin rızasını almak bir yana, adil bir şekilde tazmin edilmeden.

Bu uygulama halihazırda bir dizi davaya yol açmış durumda; hak sahipleri OpenAI ve Microsoft gibi şirketleri, uygulamalarını, ABD telif hakkı yasasının telif hakkıyla korunan materyallerin izin alınmaksızın sınırlı kullanımına izin veren bir doktrini olan “adil kullanım “a yanlış atfetmekle suçluyor.

İLGİLİ YAZI : Samsung'un ev robotu Ballie ile tanışın

NYT’nin kendisi bile OpenAI ve Microsoft’a karşı telif hakkı ihlali suçlamasıyla dava açtı.

Geçtiğimiz hafta, NYT’nin haberini yayınlamasından günler önce, YouTube CEO’su Neal Mohan Bloomberg’e açık bir mesaj göndererek OpenAI’nin Sora’yı YouTube videoları üzerinde eğitmiş olması halinde bunun video platformunun kullanım koşullarının “açık bir ihlali” olacağını söyledi.

Google sözcüsü Matt Bryant NYT’ye YouTube’un “YouTube içeriğinin izinsiz olarak kazınmasını ya da indirilmesini” yasakladığını söyledi.

Bryant ayrıca The Verge’e şirketin OpenAI’nin faaliyetlerine ilişkin “doğrulanmamış raporlar gördüğünü” söyledi.

Açık olmak gerekirse, Sora ve GPT-4’ün ne ölçüde bağlantılı olduğunu hala tam olarak bilmiyoruz. OpenAI’nin yaklaşan metinden videoya oluşturucusu için tekerleği yeniden icat etmediğini, metin istemlerini yorumlamak için LLM tarafından desteklenen bir çeviri katmanına güvendiğini biliyoruz.

Belki de asıl soru, bir milyon saatlik YouTube videosunu izinsiz kopyalamanın hırsızlık anlamına gelip gelmediğidir. ABD’deki telif hakkı yasası, özellikle adil kullanım söz konusu olduğunda, yasal bir gri alan olmaya devam ediyor.

Uzmanlar NYT’ye, yapay zeka şirketleri internetin tamamını taradıkça, tüm içeriğin lisanslanmasının muhtemelen imkansız olacağını söyledi.

Girişim sermayesi şirketi Andreessen Horowitz’i temsil eden avukat Sy Damle gazeteye verdiği demeçte, “İhtiyaç duyulan veri o kadar büyük ki, toplu lisanslama bile gerçekten işe yaramıyor” dedi.

Tüm hakları güvence altına almadan bile, yapay zeka şirketleri yakında daha da garip bir zorlukla karşı karşıya kalabilir: eğitim verilerinin tamamen tükenmesi.

Araştırmacılar, 2026 yılına kadar YZ şirketlerinin doymak bilmeyen modellerini besleyecek yüksek kaliteli verilerin tükenme ihtimalinin yüzde 90 olduğunu ortaya koydu. Başka bir deyişle, OpenAI gibi şirketler sonunda yapay zeka modellerini sentetik, yapay zeka tarafından üretilen çıktılar üzerinde eğitmeye başvurmak zorunda kalabilir – bu, telif hakkı ile ilgili davalardan çok daha feci sonuçlar doğurabilecek tehlikeli bir dibe doğru yarış.

İLGİLİ YAZI : Sam Altman OpenAI CEO'su olarak geri dönüyor

Kaynak: Yahoo

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.

OpenAI, GPT-4’ü YouTube videosuyla gizlice eğitti

Mutlaka Okumalısın

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

Daha Fazla

CEVAP VER İptal

Son Haberler

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

KLING AI video oluşturucusu kullanıcıların kendi AI video karakterlerini eğitmelerine olanak tanıyor

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor