OpenAI, ChatGPT tarafından yazılan koddaki hataları tespit etmede insanlara yardımcı olmak için tasarlanmış yeni bir yapay zeka (AI) büyük dil modeli (LLM) olan CriticGPT adlı yeni bir araç başlattı.
GPT modellerinin doğruluğunu ve kullanışlılığını artırmak amacıyla OpenAI, İnsan Geri Bildiriminden Güçlendirme Öğrenimi (RLHF) adı verilen ve insanların AI modellerinin çıktılarını gözden geçirip eleştirdiği bir teknik kullanıyor. CriticGPT, RLHF sürecinde YZ eğitmenlerine yardımcı olmak için tasarlanmıştır.
OpenAI’ye göre, insanlar ChatGPT kodunu incelemek için CriticGPT’den yardım aldıklarında, yardım almayanlardan %60 daha iyi performans gösteriyorlar. Yapılan bir deneyde, bir insan yapay zeka eğitmeninin, insan artı CriticGPT ekibinden gelen eleştirileri, yapay zeka aracı olmayan bir insana göre %60 oranında tercih ettiği görüldü.
RLHF sürecinde geri bildirim sağlamak için bir insan ve bir yapay zekayı eşleştirmenin en büyük yararı, CriticGPT’nin tek başına çalışan bir insandan daha kapsamlı ve kapsamlı eleştiriler yazabilmesi ve model halüsinasyonlu hatalar bildirdiğinde veya CriticGPT çok fazla yararsız “nitpicks” bildirdiğinde insanların devreye girebilmesi.
CriticGPT nasıl eğitildi?
CriticGPT de OpenAI’nin RLHF metodolojileri kullanılarak eğitildi. Eğitmenler ChatGPT tarafından yazılan kodu aldı ve ardından koda hatalar ekledi. Daha sonra, eklenen hatayı bulması durumunda bir modelin sağlayabileceği örnek geri bildirim yazdılar.
Eğitmen daha sonra yeni modelin çıktılarını karşılaştırdı, değiştirilen kod parçasının birden fazla eleştirisine baktı ve modelin eklenen hatayı doğru bir şekilde tanımlayıp açıkladığını gördü.
CriticGPT’nin sınırlamaları nelerdir?
CriticGPT için şimdiye kadarki eğitim verileri yalnızca ChatGPT tarafından yazılan kısa cevaplara odaklanmıştır ve daha uzun ve daha karmaşık çıktıları ele alması için daha fazla araştırma ve geliştirme yapılması gerekecek. Ayrıca, LLM’lerin başına bela olan korkunç yapay zeka halüsinasyonlarından arınmış değil.
Modelin dağınık hataları tanımlayabilmesi ve eleştirebilmesi için de daha fazla çalışma yapılması gerekecek; şu anda yalnızca tek bir yerde görünen ayrık hataları ele alabiliyor.
CriticGPT için sırada ne var?
OpenAI, CriticGPT’yi RLHF hattına entegre etmeyi ve ardından çalışmayı daha da ölçeklendirmeyi ve faydasını artırmayı amaçlıyor.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.