Seattle’daki Tencent Yapay Zeka Laboratuvarı’ndaki araştırmacılar, sentetik veri üretmek için yeni bir yöntem tanıttı: Sentetik kişilikler.
Tencent AI Lab bunlara “kişilikler” adını veriyor ve yapay zeka sistemleri geliştirmek için milyarlarca sentetik veri kümesi üretmek amacıyla gerçek insanların yerine geçen kişiler yaratıyor.
Araştırmanın bir parçası olarak ekip, 1 milyar sanal karakterden oluşan bir koleksiyon olan “Persona Hub”ı oluşturdu. Araştırmacılar iki yaklaşım kullanıyor: “Text-to-Persona”, kişilikleri web metinlerinden türetirken, “Persona-to-Persona”, daha önce oluşturulmuş kişiliklerle ilişkilere dayalı olarak yeni kişilikler üretiyor. Prensipte, kişilikler sentetik veriler için bir tür çarpan görevi görüyor, çünkü farklı geçmişler her biri kendi veri varyantlarını üretebiliyor, tıpkı atanmış bir rolün istem sırasında dil modellerinin çıktısını nasıl etkilediğine benzer şekilde.
Yapay zeka modellerini eğitmek için çok çeşitli veriler üretmek amacıyla sentetik kişiler kullanılabilir. Araştırmacılar matematiksel problemler, mantıksal düşünme görevleri ve dil modelleri için talimatlar gibi örnekler veriyor.
Kişiler büyük dil modellerinden bilgiyi “okuyabilir”
Bir deneyde, araştırmacılar Persona Hub’ı kullanarak 1,07 milyon matematik problemi ürettiler. Bu veriler üzerinde eğitilen 7 milyar parametreli bir model, MATH kıyaslamasında %64,9’luk bir doğruluk elde etti ve OpenAI’nin gpt-4-turbo-preview’inin performansına model boyutunun çok daha küçük bir kısmında ulaştı.
Bilim insanları, yöntemlerinde yapay zeka için veri üretiminde bir paradigma değişimi potansiyeli görüyor. İnsan tarafından üretilen verilere güvenmek yerine, büyük dil modelleri gelecekte çeşitli sentetik verileri kendileri üretebilir. Ekip, NPC’ler için video oyunlarında veya mesleğe özgü araçların geliştirilmesinde daha fazla potansiyel uygulama görüyor.
Ancak yayın ayrıca olası risklere ve etik kaygılara da işaret ediyor. Örneğin, yöntem bir dil modelinde depolanan tüm bilgi tabanını etkili bir şekilde “okumayı” ve çoğaltmayı mümkün kılabilir.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.