OpenAI'nin Q*'su olan tavşan deliğinden aşağı düşmeyin

Bu yazıda neler var?

Q*, AGI (Artificial General Intelligence – Yapay Genel Zeka) ve kısa süreliğine işsiz kalan bir CEO. Ortalık yatıştı. İddia edilen buluş hakkında bildiklerimiz.

Reuters tarafından yayınlanan bir habere göre, Q* olarak bilinen OpenAI tarafından gerçekleştirildiği iddia edilen bir yapay zeka buluşunun, insanlığa yönelik potansiyel bir tehdit konusunda şirket içinde endişelere yol açtığı söyleniyor. Keşif, OpenAI’nin eski CEO’su Sam Altman’ın görevden alınmasından önce gerçekleşti ve ilgili araştırmacılar tarafından yönetim kuruluna sunulan şikayet listesinin bir parçasıydı ya da öyle söyleniyor.

Q*’nun tam doğası belirsizliğini korurken, internet en iyi yaptığı şeyi yapıyor ve ayık varsayımlardan vahşi spekülasyonlara kadar her şeyi sağlıyor.

Bir Q* neden gereklidir?

OpenAI’nin ChatGPT’si gibi mevcut yapay zeka teknolojileri, kalıpları tanıyabilir, çıkarımlar yapabilir ve daha önce görülen kalıplara dayalı yanıtlar üretebilir. Bununla birlikte, az ya da çok sağlam muhakeme gibi insan zekasının merkezinde olduğunu düşündüğümüz birçok yetenekten yoksundur. Örneğin, yakın zamanda yapılan bir deney, dil modellerinin “A, B’dir” şeklindeki basit formülü “B, A’dır” şeklinde genelleyemediğini göstermiştir.

Q*’nun bazı matematiksel problemleri çözebildiği bildiriliyor. Mevcut büyük dil modelleri matematikte oldukça kötüdür, bu nedenle OpenAI, ChatGPT’nin matematiksel yeteneklerini genişletmek için Gelişmiş Veri Analitiği gibi harici eklentiler kullanır. Ancak bu hikayeyle daha ilgili olan, şirketin birkaç ay önce yayınladığı bir makale. Bu makalede, şirketten bir ekip “süreç denetimi” adı verilen bir yöntemle dil modellerinin matematiksel yeteneklerini önemli ölçüde geliştirmeyi başardı.

Süreç denetimi, modelin muhakemesinin her adımında insan geri bildirimi aldığı ve onu doğru cevaba yönlendirdiği bir takviye öğrenme biçimidir. Bu, ChatGPT’de RLHF için kullanılan “sonuç denetiminin” tersidir. İnsan geri bildirimlerinden öğrenen süreç denetimli ödül modelleri (PRM’ler) süreç denetimi için kullanılabilir. OpenAI araştırmacısı John Schulman bir sunumunda bu süreçlerin merkezi rolünü açıklamıştır.

İLGİLİ YAZI : Midjourney web üzerinde yapay zeka ile görüntü üretimi için alfa sürümünü kullanıma sundu

Uzmanlar Q* hakkında ne diyor?

PRM’lerin Q* ile ne ilgisi var? Bazı uzmanlara göre, LLM’leri planlama ile birleştirmesi muhtemel olan sistemin önemli bir parçası olabilirler.

Dil modellerine ek olarak, Q* muhtemelen “düşünceleri” keşfetmek için Tree-of-Thoughts, Monte-Carlo Tree Search (MCTS), yukarıda bahsedilen PRM’ler ve Q-learning gibi bir öğrenme algoritmasına benzer doğrusal olmayan bir yönteme dayanmaktadır. Nvidia’dan Jim Fan, Twitter.com’daki uzun bir gönderide ayrıntıları açıklıyor.

Varsayım doğruysa, Q*, AlphaZero’da bulunanlar gibi fikirleri dil modelleriyle birleştiriyor; Microsoft araştırmacılarının kısa süre önce “Everything of Thoughts” ile gösterdiklerine benzer. Microsoft ekibi Game of 24 ya da 8-Puzzle gibi oyunlarda etkileyici bir performans elde etti ancak yüzde 100 güvenilirlik elde edemedi.

Böyle bir kombinasyonun prensipte iyi sonuçlar vaat ettiği bir sır değil: Google Deepmind’ın CEO’su Demis Hassabis bir röportajında AlphaGo’daki fikirleri Gemini’ye dahil etmeyi planladıklarını açıkladı.

Test zamanı hesaplama ve masa oyunları

The Information’ın bildirdiğine göre, başka bir kavram da önemli bir rol oynuyor: “Test Zamanı Hesaplama”. Bu, esasen bir sistemin bir cevabı bulmak için sahip olduğu süredir. AlphaGo’ya arama yapması için daha fazla zaman verildiğinde performansını önemli ölçüde artırdığı bilinmektedir. Bu olgunun Hex oynayan yapay zeka sistemleriyle yapılan sistematik bir çalışması, MCTS’nin eğitim hesaplama ve çıkarım hesaplama işlemlerinin birbirlerine karşı neredeyse bire bir takas edilebileceğini göstermiştir.

Benzer bir olgu poker yapay zekası Libratus ile de gözlemlenmiştir. Makalenin yazarlarından biri olan Noam Brown, bu yaz OpenAI’ye katıldı ve Twitter.com’da eğitim süresi ile test süresi arasındaki değiş tokuşun önemi hakkında bir yazı yayınladı.

Bu tür yöntemlerin oyunların ötesinde genelleştirilmesi konusunda büyük umutları var.

“Tüm bu önceki yöntemler oyuna özgüdür. Ancak genel bir versiyonunu keşfedebilirsek, faydaları çok büyük olabilir. Evet, çıkarım 1.000 kat daha yavaş ve maliyetli olabilir ama yeni bir kanser ilacı için ne kadar çıkarım maliyeti öderiz? Ya da Riemann Hipotezi’nin bir kanıtı için?”

İLGİLİ YAZI : Microsoft'un Copilot'u nedir? Yapay zeka asistanı hakkında bilmeniz gereken her şey

Q*, Q-öğrenme ve bazı spekülasyonlar hakkında daha fazla bilgi

Q* her ne ise, muhtemelen AGI değildir ve hatta temel bir atılımı temsil etmeyebilir. Ancak daha güvenilir olan ve ChatGPT gibi günümüz sistemlerinin sorunlarının bir kısmını ya da çoğunu çözen yeni nesil YZ sistemlerinin bir örneği olması muhtemeldir.

Q* söylentilerinin yorumlanması, bağlamından koparılmış kısa alıntılar, videolardan duygusal durumların yorumlanması ve genel AGI tefsiri ile daha çok Q-Anon’un Silikon Vadisi versiyonunu andıran bir seviyeye ulaşmışken, daha fazla cevap için beklememiz gerekecek. Q*’yu şifrelemeyi kırabilen tehlikeli bir YZ sistemi olarak gösteren sahte bir mektup olduğundan şüpheleniliyor.

Daha derinlere inmek isterseniz, Q* hakkında spekülasyon yapan birçok makale ve video bulabilirsiniz. Forbes, burada bahsedilen yöntem ve kavramların birçok ayrıntısına inen derinlemesine bir makale yayınladı. Yapay zeka araştırmacısı Nathan Lambert, Q*’nun Düşünce Ağaçları ve PRM’leri kullandığını varsaydığı ilk blog yazılarından birini yayınladı.

Bazı ilgili videolar

CBCNews – YZ araştırmacısı Yoshua Bengio ile yapılan bir röportaj da dahil olmak üzere kısa bir genel bakış.

Yannic Kilcher: Q-Learning’in Açıklaması

AI Explained – DeepDive ve Q*’nun detayları hakkında bazı spekülasyonlar.

Kaynak: Maximilian Schreiner / The-Decoder

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn ve Instagram‘da takip edin.

OpenAI’nin Q*’su olan tavşan deliğinden aşağı düşmeyin

Mutlaka Okumalısın

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

Bir Q* neden gereklidir?

Uzmanlar Q* hakkında ne diyor?

Test zamanı hesaplama ve masa oyunları

Q*, Q-öğrenme ve bazı spekülasyonlar hakkında daha fazla bilgi

Bazı ilgili videolar

Daha Fazla

CEVAP VER İptal

Son Haberler

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

KLING AI video oluşturucusu kullanıcıların kendi AI video karakterlerini eğitmelerine olanak tanıyor

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor