32.9 C
İstanbul

Tencent araştırmacıları, veri üretimi için yapay zeka tarafından oluşturulmuş kişiliklerden oluşan bir ordu kuruyor

Seattle'daki Tencent AI Lab araştırmacıları, yapay zeka modellerini eğitmek için milyarlarca veri kümesi oluşturmak amacıyla sentetik kişilikleri kullanmanın bir yolunu geliştirdiler.

Mutlaka Okumalısın

Seattle’daki Tencent Yapay Zeka Laboratuvarı’ndaki araştırmacılar, sentetik veri üretmek için yeni bir yöntem tanıttı: Sentetik kişilikler.

Tencent AI Lab bunlara “kişilikler” adını veriyor ve yapay zeka sistemleri geliştirmek için milyarlarca sentetik veri kümesi üretmek amacıyla gerçek insanların yerine geçen kişiler yaratıyor.

Araştırmanın bir parçası olarak ekip, 1 milyar sanal karakterden oluşan bir koleksiyon olan “Persona Hub”ı oluşturdu. Araştırmacılar iki yaklaşım kullanıyor: “Text-to-Persona”, kişilikleri web metinlerinden türetirken, “Persona-to-Persona”, daha önce oluşturulmuş kişiliklerle ilişkilere dayalı olarak yeni kişilikler üretiyor. Prensipte, kişilikler sentetik veriler için bir tür çarpan görevi görüyor, çünkü farklı geçmişler her biri kendi veri varyantlarını üretebiliyor, tıpkı atanmış bir rolün istem sırasında dil modellerinin çıktısını nasıl etkilediğine benzer şekilde.

Yapay zeka modellerini eğitmek için çok çeşitli veriler üretmek amacıyla sentetik kişiler kullanılabilir. Araştırmacılar matematiksel problemler, mantıksal düşünme görevleri ve dil modelleri için talimatlar gibi örnekler veriyor.

Kişiler büyük dil modellerinden bilgiyi “okuyabilir”

Bir deneyde, araştırmacılar Persona Hub’ı kullanarak 1,07 milyon matematik problemi ürettiler. Bu veriler üzerinde eğitilen 7 milyar parametreli bir model, MATH kıyaslamasında %64,9’luk bir doğruluk elde etti ve OpenAI’nin gpt-4-turbo-preview’inin performansına model boyutunun çok daha küçük bir kısmında ulaştı.

Bilim insanları, yöntemlerinde yapay zeka için veri üretiminde bir paradigma değişimi potansiyeli görüyor. İnsan tarafından üretilen verilere güvenmek yerine, büyük dil modelleri gelecekte çeşitli sentetik verileri kendileri üretebilir. Ekip, NPC’ler için video oyunlarında veya mesleğe özgü araçların geliştirilmesinde daha fazla potansiyel uygulama görüyor.

Ancak yayın ayrıca olası risklere ve etik kaygılara da işaret ediyor. Örneğin, yöntem bir dil modelinde depolanan tüm bilgi tabanını etkili bir şekilde “okumayı” ve çoğaltmayı mümkün kılabilir.

İLGİLİ YAZI :   OpenAI, DALL-E 3'ü C2PA meta verileriyle donatıyor

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler