Yapay zekalı robotların 'GPT anı' yakın

Bu yazıda neler var?

Temel modellerin dijital dünyada yapay zekayı dönüştürdüğü bir sır değil. ChatGPT, LLaMA ve Bard gibi büyük dil modelleri (LLM’ler) dil için yapay zekada devrim yarattı. OpenAI’nin GPT modelleri mevcut tek büyük dil modeli olmasa da, karmaşık problem çözme ve gelişmiş muhakeme gerektiren bazı görevlerde bile metin ve görüntü girdilerini alıp insan benzeri yanıtlar sunma konusunda en yaygın tanınırlığı elde ettiler.

ChatGPT’nin viral ve yaygın olarak benimsenmesi, toplumun yapay zeka için bu yeni anı nasıl anladığını büyük ölçüde şekillendirdi.

Nesiller boyunca yapay zekayı tanımlayacak olan bir sonraki gelişme robotiktir. Fiziksel dünyayla nasıl etkileşime gireceğini öğrenebilen yapay zeka destekli robotlar inşa etmek, lojistik, ulaşım ve üretimden perakende, tarım ve hatta sağlık hizmetlerine kadar çeşitli sektörlerde tekrar eden her türlü işi geliştirecektir. Ayrıca, son birkaç on yılda dijital dünyada gördüğümüz gibi fiziksel dünyada da birçok verimliliğin kilidini açacaktır.

Dile kıyasla robotikte çözülmesi gereken benzersiz bir dizi sorun olsa da, temel temel kavramlar arasında benzerlikler vardır. Ve yapay zeka alanındaki en parlak beyinlerden bazıları “robotik için GPT” oluşturmada önemli ilerleme kaydetti.

GPT’nin başarısını sağlayan nedir?

“Robotik için GPT”nin nasıl inşa edileceğini anlamak için, öncelikle GPT gibi LLM’lerin başarısını sağlayan temel dayanaklara bakalım.

Temel model yaklaşımı

GPT, geniş ve çeşitli bir veri kümesi üzerinde eğitilmiş bir yapay zeka modelidir. Mühendisler daha önce veri toplamış ve belirli bir sorun için belirli bir yapay zekayı eğitmişlerdir. Daha sonra başka bir sorunu çözmek için yeni veriler toplamaları gerekecekti. Başka bir sorun mu? Yine yeni veriler. Şimdi ise temel model yaklaşımıyla bunun tam tersi gerçekleşiyor.

İLGİLİ YAZI : Billie Eilish ve Katy Perry dahil 200 sanatçıdan yapay zeka protestosu

Her kullanım durumu için niş YZ’ler oluşturmak yerine, bir tanesi evrensel olarak kullanılabilir. Ve bu çok genel model, tüm özel modellerden daha başarılıdır. Bir temel modeldeki YZ, belirli bir görevde daha iyi performans gösterir. Diğer görevlerden öğrendiklerinden yararlanabilir ve yeni görevlere daha iyi genelleme yapabilir, çünkü çeşitli görevlerde iyi performans gösterme zorunluluğundan ek beceriler öğrenmiştir.

Büyük, tescilli ve yüksek kaliteli bir veri kümesi üzerinde eğitim

Genelleştirilmiş bir yapay zekaya sahip olmak için öncelikle büyük miktarda çeşitli veriye erişmeniz gerekir. OpenAI, GPT modellerini makul ölçüde verimli bir şekilde eğitmek için gereken gerçek dünya verilerini elde etti. GPT, kitaplar, haber makaleleri, sosyal medya gönderileri, kodlar ve daha fazlası dahil olmak üzere geniş ve çeşitli bir veri kümesiyle tüm internetten toplanan veriler üzerinde eğitim aldı.

Önemli olan sadece veri setinin büyüklüğü değil; yüksek kaliteli, yüksek değerli verilerin küratörlüğünü yapmak da büyük bir rol oynuyor. GPT modelleri, yüksek kaliteli veri kümeleri ağırlıklı olarak kullanıcıların önem verdiği görevler ve en yararlı yanıtlar tarafından bilgilendirildiği için benzeri görülmemiş bir performans elde etti.

Takviyeli öğrenmenin (RL) rolü

OpenAI, modelin tepkisini insan tercihiyle (örneğin, bir kullanıcı için neyin faydalı olduğu düşünülür) uyumlu hale getirmek için insan geri bildiriminden takviye öğrenme (RLHF) kullanır. Saf denetimli öğrenmeden (SL) daha fazlasına ihtiyaç vardır çünkü SL bir soruna yalnızca net bir model veya örnek kümesiyle yaklaşabilir. LLM’ler, yapay zekanın benzersiz, doğru bir cevap olmadan bir hedefe ulaşmasını gerektirir. RLHF’ye girin.

RLHF, bir insan doğru cevapları onaylarken (yüksek ödül) veya yanlış olanları reddederken (düşük ödül) algoritmanın deneme yanılma yoluyla bir hedefe doğru ilerlemesini sağlar. Yapay zeka, insan tercihini en iyi açıklayan ödül fonksiyonunu bulur ve ardından oraya nasıl ulaşılacağını öğrenmek için RL’yi kullanır. ChatGPT, insan geri bildirimlerinden öğrenerek insan seviyesindeki yetenekleri yansıtan veya aşan yanıtlar sunabilir.

Temel modellerin bir sonraki sınırı robotikte

GPT’nin görmesini, düşünmesini ve hatta konuşmasını sağlayan aynı çekirdek teknoloji, makinelerin de görmesini, düşünmesini ve hareket etmesini sağlar. Bir temel model tarafından desteklenen robotlar fiziksel çevrelerini anlayabilir, bilinçli kararlar alabilir ve eylemlerini değişen koşullara uyarlayabilir.

İLGİLİ YAZI : OpenAI, Google Arama rakibi SearchGPT'yi piyasaya sürdü

“Robotik için GPT”, GPT’nin inşa edildiği gibi inşa ediliyor – bildiğimiz yapay zekayı bir kez daha yeniden tanımlayacak bir devrime zemin hazırlıyor.

Temel model yaklaşımı

Temel model yaklaşımını benimseyerek, fiziksel dünyada birden fazla görevde çalışan tek bir yapay zeka da oluşturabilirsiniz. Birkaç yıl önce uzmanlar, market ürünlerini toplayan ve paketleyen robotlar için özel bir YZ yapılmasını tavsiye ediyordu. Ve bu, çeşitli elektrikli parçaları ayırabilen bir modelden farklıdır, bu da bir kamyondan paletleri boşaltan modelden farklıdır.

Bir temel modele bu paradigma kayması, yapay zekanın yapılandırılmamış gerçek dünya ortamlarında sıklıkla var olan ve aksi takdirde daha dar eğitimli modelleri zorlayabilecek uç durum senaryolarına daha iyi yanıt vermesini sağlar. Tüm bu senaryolar için tek bir genelleştirilmiş YZ oluşturmak daha başarılıdır. Her şey üzerinde eğitim alarak, önceki nesil robotlarda eksikliğini hissettiğimiz insan düzeyinde otonomiyi elde edebilirsiniz.

Büyük, tescilli ve yüksek kaliteli bir veri kümesi üzerinde eğitim

Bir robota hangi eylemlerin başarıya, hangilerinin başarısızlığa yol açtığını öğrenmeyi öğretmek son derece zordur. Gerçek dünyadaki fiziksel etkileşimlere dayanan kapsamlı ve yüksek kaliteli veriler gerektirir. Tek laboratuvar ortamları veya video örnekleri güvenilir veya yeterince sağlam kaynaklar değildir (örneğin, YouTube videoları fiziksel etkileşimin ayrıntılarını tercüme etmekte başarısız olur ve akademik veri kümeleri kapsam açısından sınırlı olma eğilimindedir).

Dil veya görüntü işleme için yapay zekanın aksine, önceden var olan hiçbir veri seti robotların fiziksel dünya ile nasıl etkileşime girmesi gerektiğini temsil etmez. Bu nedenle, büyük, yüksek kaliteli veri kümesi robotikte çözülmesi daha karmaşık bir zorluk haline gelir ve üretimde bir robot filosunun konuşlandırılması, çeşitli bir veri kümesi oluşturmanın tek yoludur.

Takviyeli öğrenmenin rolü

Metin sorularını insan seviyesinde cevaplamaya benzer şekilde, robotik kontrol ve manipülasyon, bir ajanın tek, benzersiz, doğru cevabı olmayan bir hedefe doğru ilerlemesini gerektirir (örneğin, “Bu kırmızı soğanı almanın başarılı bir yolu nedir?”). Bir kez daha, saf denetimli öğrenmeden daha fazlası gereklidir.

İLGİLİ YAZI : Apple, Dünya Geliştiriciler Konferansı'nda yapay zeka ana planını açıklayacak

Robotikte başarılı olmak için derin takviyeli öğrenme (derin RL) kullanan bir robota ihtiyacınız var. Bu otonom, kendi kendine öğrenme yaklaşımı, daha yüksek performans seviyelerinin kilidini açmak için RL’yi derin sinir ağlarıyla birleştirir – AI, öğrenme stratejilerini otomatik olarak uyarlayacak ve yeni senaryoları deneyimledikçe becerilerini ince ayarlamaya devam edecektir.

Zorlu ve patlayıcı bir büyüme geliyor

Geçtiğimiz birkaç yıl içinde, dünyanın en parlak yapay zeka ve robotik uzmanlarından bazıları, yapay zekanın geleceğini yeniden tanımlayacak bir robotik temel model devrimi için teknik ve ticari zemin hazırladı.

Bu YZ modelleri GPT’ye benzer şekilde inşa edilmiş olsa da, fiziksel dünyada insan düzeyinde otonomi elde etmek iki nedenden dolayı farklı bir bilimsel zorluktur:

Çeşitli gerçek dünya ortamlarına hizmet edebilecek YZ tabanlı bir ürün oluşturmak, dikkate değer bir dizi karmaşık fiziksel gereksinime sahiptir. Tek bir donanımın çeşitli sektörlerde (lojistik, taşımacılık, imalat, perakende, tarım, sağlık vb.) ve her sektördeki faaliyetlerde işe yarayacağı şüpheli olduğundan, YZ’nin farklı donanım uygulamalarına uyum sağlaması gerekir.
Depolar ve dağıtım merkezleri, fiziksel dünyadaki yapay zeka modelleri için ideal bir öğrenme ortamıdır. Herhangi bir anda herhangi bir tesisten yüz binlerce hatta milyonlarca farklı stok tutma biriminin (SKU) akması yaygındır – bu da “robotik için GPT “yi eğitmek için gereken büyük, özel ve yüksek kaliteli veri kümesini sağlar.

Yapay zeka robotik “GPT anı” yakın

Robotik temel modellerinin büyüme yörüngesi çok hızlı bir şekilde ivme kazanıyor. Robotik uygulamalar, özellikle de hassas nesne manipülasyonu gerektiren görevlerde, gerçek dünyadaki üretim ortamlarında halihazırda uygulanmaktadır ve 2024 yılında ticari olarak uygulanabilir robotik uygulamaların katlanarak arttığını göreceğiz.

Chen, en iyi küresel yapay zeka ve makine öğrenimi dergilerinde yer alan 30’dan fazla akademik makale yayınlamıştır.

Kaynak: *Peter Chen / Techcrunch

* Peter Chen, dünyanın önde gelen yapay zeka robotik şirketi Covariant‘ın CEO’su ve kurucu ortağıdır. Covariant’ı kurmadan önce Peter, OpenAI’de araştırma bilimcisi ve Berkeley Yapay Zeka Araştırma (BAIR) Laboratuvarı’nda araştırmacı olarak görev yaptı ve burada takviyeli öğrenme, meta-öğrenme ve denetimsiz öğrenmeye odaklandı.

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.

Yapay zekalı robotların ‘GPT anı’ yakın

Mutlaka Okumalısın

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

GPT’nin başarısını sağlayan nedir?

Temel model yaklaşımı

Büyük, tescilli ve yüksek kaliteli bir veri kümesi üzerinde eğitim

Takviyeli öğrenmenin (RL) rolü

Temel modellerin bir sonraki sınırı robotikte

Temel model yaklaşımı

Büyük, tescilli ve yüksek kaliteli bir veri kümesi üzerinde eğitim

Takviyeli öğrenmenin rolü

Zorlu ve patlayıcı bir büyüme geliyor

Yapay zeka robotik “GPT anı” yakın

Daha Fazla

CEVAP VER İptal

Son Haberler

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

KLING AI video oluşturucusu kullanıcıların kendi AI video karakterlerini eğitmelerine olanak tanıyor

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor