20.8 C
İstanbul

TikTok’un ana şirketi, dünyanın çevrimiçi verilerini OpenAI’den 25 kat daha hızlı toplayan bir web kazıyıcı başlattı

TikTok'un ana şirketi ByteDance, çevrimiçi içeriği en büyük rakibi OpenAI'dan 25 kat daha hızlı kazıyan bir bot kullanmaya başladı.

Mutlaka Okumalısın

TikTok’un ana şirketi ByteDance, çevrimiçi içeriği rakiplerinden çok daha fazla miktarda kazıyan bir bot kullanıyor. ByteDance, üretken yapay zeka modellerini eğitmek için gereken veriler için web’i kazıma söz konusu olduğunda kaybedilen zamanı telafi etmeye istekli görünüyor.

Video uygulaması TikTok’un Çin merkezli ana şirketi, çevrimiçi verilere sahip şirketler için bot yönetimi konusunda uzmanlaşmış bir şirket olan Kasada’nın araştırmasına göre, Nisan ayında Bytespider adlı kendi web tarayıcı veya kazıyıcı botunu piyasaya sürdü. Botun varlığı, kazıyıcı botları izleyen Dark Visitors tarafından da doğrulandı.

Araştırmaya göre ByteDance’in botu kısa sürede internetteki en agresif kazıyıcılardan biri haline geldi. LLM’ler ya da LMM’ler olarak bilinen büyük dil ya da çok modlu modellerini oluşturmak ve geliştirmek için kendi kazıyıcı botlarını kullanan Google, Meta, Amazon, OpenAI ve Anthropic gibi diğer büyük şirketlerin katları oranında veri kazıyor.

Kasada’nın CEO’su Sam Crowther, Bytespider’ın ortaya çıkmasından bu yana, örneğin OpenAI’nin ChatGPT platformu ve temel modelleri için veri toplayan GPTbot’un yaklaşık 25 katı oranında veri topladığını söyledi. Bytespider, Claude platformunu işleten Anthropic’in ClaudeBot’unun 3.000 katı oranında veri kazıyor.

Kasada’ya göre aylar geçtikçe Bytespider daha da agresifleşti. Veriler, son altı haftanın her birinde Bytespider’ın kazıma faaliyetinde büyük artışlar olduğunu gösteriyor. TikTok ve ByteDance temsilcileri yorum isteyen e-postalara yanıt vermedi.

TikTok ABD’de yasaklanabilir

ByteDance’ın agresif kazıması, TikTok’un önümüzdeki aylarda ABD’de yasaklanma ihtimaline rağmen gerçekleşiyor. Başkan Joe Biden, ByteDance’ın ulusal güvenlik kaygıları nedeniyle TikTok’u satmasını ya da kapatmasını gerektiren yasayı imzaladı.

Araştırmaya göre Bytespider botu, OpenAI ve Anthropic botları gibi robots.txt’ye saygı göstermiyor. Robots.txt, yayıncıların bir web sitesine koyabilecekleri, yasal olarak hiçbir şekilde bağlayıcı olmasa da, kazıyıcı botlara o web sitesinin verilerini alamayacaklarını bildirmesi gereken bir kod satırı.

İLGİLİ YAZI :   Microsoft, OpenAI rekabet endişelerini gidermek için 'Yapay Zeka erişim ilkelerini' duyurdu

Web kazıma onlarca yıl öncesine dayanıyor, özellikle de arama motorları tarafından web sayfalarına bağlantılar toplamak için. Ancak üretici yapay zeka araçlarının yükselişi yeni bir boyut kattı ve uygulamayı davaların ve tartışmaların ana kaynağı haline getirdi. Çalışmaları kazınan kişi ve kuruluşlar, bu süreçte telif haklarının ihlal edildiğini savunuyor.

Üretken yapay zeka araçlarının temelini oluşturan tüm modeller, web’de bulunan her şey, özellikle de yazılı bilgiler olmak üzere büyük miktarda çevrimiçi veri üzerinde eğitildi. Teknoloji şirketleri bu verilerin tamamını ücretsiz olarak kopyalamak ve veri kümelerine eklemek için kazıyıcı botlar kullanıyor.

Crowther, Bytespider tarafından yapılan agresif kazıma için “Sanki umutsuzca yetişmeye çalışıyorlar” dedi. Daha geçen yıl, ByteDance’ın üretici yapay zeka yarışında o kadar geride kaldığı bildirilmişti ki, ByteDance’ın kendi LLM’sini oluşturmaya yardımcı olmak için OpenAI’yi kullanıyordu ki bu OpenAI’nin hizmet şartlarına aykırı.

Bu yılın başlarında ByteDance, Duabo adında sohbet tabanlı bir LLM yayınladı, ancak bu model üzerindeki çalışmalar Bytespider tarafından kazınan daha yeni eğitim verilerinin birikmesinden önce tamamlanmış olacaktı. Şirket hakkında bilgi sahibi bir kişiye göre ByteDance’ın yeni bir LLM üzerinde çalıştığı “açık”.

ByteDance’ın yeni bir LLM ile ne yapmayı planladığına gelince, şirketin hedeflerini bilen bir kişi, hedeflerden birinin TikTok için arama işleviyle ilgili olduğunu söyledi. Geçtiğimiz hafta TikTok, reklamlar için anahtar kelimelere odaklanan mevcut arama işlevinde bir güncelleme yayınladı ve temel olarak reklamverenlerin TikTok’ta trend olan kelimeleri gerçek zamanlı olarak aramasına izin verdi. Pazarlamacıların, reklamın daha fazla kullanıcının ekranında görünmesine yardımcı olacak alakalı anahtar kelimelerle bir reklam oluşturmasına olanak tanıyor.

Şirketin hedeflerini bilen bir kişiye göre, daha yeni internet trendleri ve konuları hakkında veriler içeren yeni bir yapay zeka modeli, TikTok’un arama ortamını daha da genişletebilir ve geliştirebilir.

İLGİLİ YAZI :   Yapay zeka öğretmenlerin iş yükünü azaltacak da...

Bu kişi, “Kitle ve kullanım miktarı göz önüne alındığında, TikTok’un anahtar kelimeler ve konularla tamamen teklif verilebilir bir alan olan bir arama ortamına sahip olması, şu anda Google’a tonlarca para harcayan birçok insan için çok ilginç olacaktır” dedi.

Kaynak: Fortune


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler