OpenAI, ChatGPT hatalarını yakalamak için CriticGPT'yi başlattı

Bu yazıda neler var?

OpenAI, ChatGPT tarafından yazılan koddaki hataları tespit etmede insanlara yardımcı olmak için tasarlanmış yeni bir yapay zeka (AI) büyük dil modeli (LLM) olan CriticGPT adlı yeni bir araç başlattı.

GPT modellerinin doğruluğunu ve kullanışlılığını artırmak amacıyla OpenAI, İnsan Geri Bildiriminden Güçlendirme Öğrenimi (RLHF) adı verilen ve insanların AI modellerinin çıktılarını gözden geçirip eleştirdiği bir teknik kullanıyor. CriticGPT, RLHF sürecinde YZ eğitmenlerine yardımcı olmak için tasarlanmıştır.

OpenAI’ye göre, insanlar ChatGPT kodunu incelemek için CriticGPT’den yardım aldıklarında, yardım almayanlardan %60 daha iyi performans gösteriyorlar. Yapılan bir deneyde, bir insan yapay zeka eğitmeninin, insan artı CriticGPT ekibinden gelen eleştirileri, yapay zeka aracı olmayan bir insana göre %60 oranında tercih ettiği görüldü.

RLHF sürecinde geri bildirim sağlamak için bir insan ve bir yapay zekayı eşleştirmenin en büyük yararı, CriticGPT’nin tek başına çalışan bir insandan daha kapsamlı ve kapsamlı eleştiriler yazabilmesi ve model halüsinasyonlu hatalar bildirdiğinde veya CriticGPT çok fazla yararsız “nitpicks” bildirdiğinde insanların devreye girebilmesi.

CriticGPT nasıl eğitildi?

CriticGPT de OpenAI’nin RLHF metodolojileri kullanılarak eğitildi. Eğitmenler ChatGPT tarafından yazılan kodu aldı ve ardından koda hatalar ekledi. Daha sonra, eklenen hatayı bulması durumunda bir modelin sağlayabileceği örnek geri bildirim yazdılar.

Eğitmen daha sonra yeni modelin çıktılarını karşılaştırdı, değiştirilen kod parçasının birden fazla eleştirisine baktı ve modelin eklenen hatayı doğru bir şekilde tanımlayıp açıkladığını gördü.

CriticGPT’nin sınırlamaları nelerdir?

CriticGPT için şimdiye kadarki eğitim verileri yalnızca ChatGPT tarafından yazılan kısa cevaplara odaklanmıştır ve daha uzun ve daha karmaşık çıktıları ele alması için daha fazla araştırma ve geliştirme yapılması gerekecek. Ayrıca, LLM’lerin başına bela olan korkunç yapay zeka halüsinasyonlarından arınmış değil.

İLGİLİ YAZI : Larry Ellison: Yapay zeka bir gün her hareketinizi takip edecek

Modelin dağınık hataları tanımlayabilmesi ve eleştirebilmesi için de daha fazla çalışma yapılması gerekecek; şu anda yalnızca tek bir yerde görünen ayrık hataları ele alabiliyor.

CriticGPT için sırada ne var?

OpenAI, CriticGPT’yi RLHF hattına entegre etmeyi ve ardından çalışmayı daha da ölçeklendirmeyi ve faydasını artırmayı amaçlıyor.

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

OpenAI, ChatGPT hatalarını yakalamak için CriticGPT’yi başlattı

Mutlaka Okumalısın

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

CriticGPT nasıl eğitildi?

CriticGPT’nin sınırlamaları nelerdir?

CriticGPT için sırada ne var?

Daha Fazla

CEVAP VER İptal

Son Haberler

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

KLING AI video oluşturucusu kullanıcıların kendi AI video karakterlerini eğitmelerine olanak tanıyor

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor