Temel modellerin dijital dünyada yapay zekayı dönüştürdüğü bir sır değil. ChatGPT, LLaMA ve Bard gibi büyük dil modelleri (LLM’ler) dil için yapay zekada devrim yarattı. OpenAI’nin GPT modelleri mevcut tek büyük dil modeli olmasa da, karmaşık problem çözme ve gelişmiş muhakeme gerektiren bazı görevlerde bile metin ve görüntü girdilerini alıp insan benzeri yanıtlar sunma konusunda en yaygın tanınırlığı elde ettiler.
ChatGPT’nin viral ve yaygın olarak benimsenmesi, toplumun yapay zeka için bu yeni anı nasıl anladığını büyük ölçüde şekillendirdi.
Nesiller boyunca yapay zekayı tanımlayacak olan bir sonraki gelişme robotiktir. Fiziksel dünyayla nasıl etkileşime gireceğini öğrenebilen yapay zeka destekli robotlar inşa etmek, lojistik, ulaşım ve üretimden perakende, tarım ve hatta sağlık hizmetlerine kadar çeşitli sektörlerde tekrar eden her türlü işi geliştirecektir. Ayrıca, son birkaç on yılda dijital dünyada gördüğümüz gibi fiziksel dünyada da birçok verimliliğin kilidini açacaktır.
Dile kıyasla robotikte çözülmesi gereken benzersiz bir dizi sorun olsa da, temel temel kavramlar arasında benzerlikler vardır. Ve yapay zeka alanındaki en parlak beyinlerden bazıları “robotik için GPT” oluşturmada önemli ilerleme kaydetti.
GPT’nin başarısını sağlayan nedir?
“Robotik için GPT”nin nasıl inşa edileceğini anlamak için, öncelikle GPT gibi LLM’lerin başarısını sağlayan temel dayanaklara bakalım.
Temel model yaklaşımı
GPT, geniş ve çeşitli bir veri kümesi üzerinde eğitilmiş bir yapay zeka modelidir. Mühendisler daha önce veri toplamış ve belirli bir sorun için belirli bir yapay zekayı eğitmişlerdir. Daha sonra başka bir sorunu çözmek için yeni veriler toplamaları gerekecekti. Başka bir sorun mu? Yine yeni veriler. Şimdi ise temel model yaklaşımıyla bunun tam tersi gerçekleşiyor.
Her kullanım durumu için niş YZ’ler oluşturmak yerine, bir tanesi evrensel olarak kullanılabilir. Ve bu çok genel model, tüm özel modellerden daha başarılıdır. Bir temel modeldeki YZ, belirli bir görevde daha iyi performans gösterir. Diğer görevlerden öğrendiklerinden yararlanabilir ve yeni görevlere daha iyi genelleme yapabilir, çünkü çeşitli görevlerde iyi performans gösterme zorunluluğundan ek beceriler öğrenmiştir.
Büyük, tescilli ve yüksek kaliteli bir veri kümesi üzerinde eğitim
Genelleştirilmiş bir yapay zekaya sahip olmak için öncelikle büyük miktarda çeşitli veriye erişmeniz gerekir. OpenAI, GPT modellerini makul ölçüde verimli bir şekilde eğitmek için gereken gerçek dünya verilerini elde etti. GPT, kitaplar, haber makaleleri, sosyal medya gönderileri, kodlar ve daha fazlası dahil olmak üzere geniş ve çeşitli bir veri kümesiyle tüm internetten toplanan veriler üzerinde eğitim aldı.
Önemli olan sadece veri setinin büyüklüğü değil; yüksek kaliteli, yüksek değerli verilerin küratörlüğünü yapmak da büyük bir rol oynuyor. GPT modelleri, yüksek kaliteli veri kümeleri ağırlıklı olarak kullanıcıların önem verdiği görevler ve en yararlı yanıtlar tarafından bilgilendirildiği için benzeri görülmemiş bir performans elde etti.
Takviyeli öğrenmenin (RL) rolü
OpenAI, modelin tepkisini insan tercihiyle (örneğin, bir kullanıcı için neyin faydalı olduğu düşünülür) uyumlu hale getirmek için insan geri bildiriminden takviye öğrenme (RLHF) kullanır. Saf denetimli öğrenmeden (SL) daha fazlasına ihtiyaç vardır çünkü SL bir soruna yalnızca net bir model veya örnek kümesiyle yaklaşabilir. LLM’ler, yapay zekanın benzersiz, doğru bir cevap olmadan bir hedefe ulaşmasını gerektirir. RLHF’ye girin.
RLHF, bir insan doğru cevapları onaylarken (yüksek ödül) veya yanlış olanları reddederken (düşük ödül) algoritmanın deneme yanılma yoluyla bir hedefe doğru ilerlemesini sağlar. Yapay zeka, insan tercihini en iyi açıklayan ödül fonksiyonunu bulur ve ardından oraya nasıl ulaşılacağını öğrenmek için RL’yi kullanır. ChatGPT, insan geri bildirimlerinden öğrenerek insan seviyesindeki yetenekleri yansıtan veya aşan yanıtlar sunabilir.
Temel modellerin bir sonraki sınırı robotikte
GPT’nin görmesini, düşünmesini ve hatta konuşmasını sağlayan aynı çekirdek teknoloji, makinelerin de görmesini, düşünmesini ve hareket etmesini sağlar. Bir temel model tarafından desteklenen robotlar fiziksel çevrelerini anlayabilir, bilinçli kararlar alabilir ve eylemlerini değişen koşullara uyarlayabilir.
“Robotik için GPT”, GPT’nin inşa edildiği gibi inşa ediliyor – bildiğimiz yapay zekayı bir kez daha yeniden tanımlayacak bir devrime zemin hazırlıyor.
Temel model yaklaşımı
Temel model yaklaşımını benimseyerek, fiziksel dünyada birden fazla görevde çalışan tek bir yapay zeka da oluşturabilirsiniz. Birkaç yıl önce uzmanlar, market ürünlerini toplayan ve paketleyen robotlar için özel bir YZ yapılmasını tavsiye ediyordu. Ve bu, çeşitli elektrikli parçaları ayırabilen bir modelden farklıdır, bu da bir kamyondan paletleri boşaltan modelden farklıdır.
Bir temel modele bu paradigma kayması, yapay zekanın yapılandırılmamış gerçek dünya ortamlarında sıklıkla var olan ve aksi takdirde daha dar eğitimli modelleri zorlayabilecek uç durum senaryolarına daha iyi yanıt vermesini sağlar. Tüm bu senaryolar için tek bir genelleştirilmiş YZ oluşturmak daha başarılıdır. Her şey üzerinde eğitim alarak, önceki nesil robotlarda eksikliğini hissettiğimiz insan düzeyinde otonomiyi elde edebilirsiniz.
Büyük, tescilli ve yüksek kaliteli bir veri kümesi üzerinde eğitim
Bir robota hangi eylemlerin başarıya, hangilerinin başarısızlığa yol açtığını öğrenmeyi öğretmek son derece zordur. Gerçek dünyadaki fiziksel etkileşimlere dayanan kapsamlı ve yüksek kaliteli veriler gerektirir. Tek laboratuvar ortamları veya video örnekleri güvenilir veya yeterince sağlam kaynaklar değildir (örneğin, YouTube videoları fiziksel etkileşimin ayrıntılarını tercüme etmekte başarısız olur ve akademik veri kümeleri kapsam açısından sınırlı olma eğilimindedir).
Dil veya görüntü işleme için yapay zekanın aksine, önceden var olan hiçbir veri seti robotların fiziksel dünya ile nasıl etkileşime girmesi gerektiğini temsil etmez. Bu nedenle, büyük, yüksek kaliteli veri kümesi robotikte çözülmesi daha karmaşık bir zorluk haline gelir ve üretimde bir robot filosunun konuşlandırılması, çeşitli bir veri kümesi oluşturmanın tek yoludur.
Takviyeli öğrenmenin rolü
Metin sorularını insan seviyesinde cevaplamaya benzer şekilde, robotik kontrol ve manipülasyon, bir ajanın tek, benzersiz, doğru cevabı olmayan bir hedefe doğru ilerlemesini gerektirir (örneğin, “Bu kırmızı soğanı almanın başarılı bir yolu nedir?”). Bir kez daha, saf denetimli öğrenmeden daha fazlası gereklidir.
Robotikte başarılı olmak için derin takviyeli öğrenme (derin RL) kullanan bir robota ihtiyacınız var. Bu otonom, kendi kendine öğrenme yaklaşımı, daha yüksek performans seviyelerinin kilidini açmak için RL’yi derin sinir ağlarıyla birleştirir – AI, öğrenme stratejilerini otomatik olarak uyarlayacak ve yeni senaryoları deneyimledikçe becerilerini ince ayarlamaya devam edecektir.
Zorlu ve patlayıcı bir büyüme geliyor
Geçtiğimiz birkaç yıl içinde, dünyanın en parlak yapay zeka ve robotik uzmanlarından bazıları, yapay zekanın geleceğini yeniden tanımlayacak bir robotik temel model devrimi için teknik ve ticari zemin hazırladı.
Bu YZ modelleri GPT’ye benzer şekilde inşa edilmiş olsa da, fiziksel dünyada insan düzeyinde otonomi elde etmek iki nedenden dolayı farklı bir bilimsel zorluktur:
Çeşitli gerçek dünya ortamlarına hizmet edebilecek YZ tabanlı bir ürün oluşturmak, dikkate değer bir dizi karmaşık fiziksel gereksinime sahiptir. Tek bir donanımın çeşitli sektörlerde (lojistik, taşımacılık, imalat, perakende, tarım, sağlık vb.) ve her sektördeki faaliyetlerde işe yarayacağı şüpheli olduğundan, YZ’nin farklı donanım uygulamalarına uyum sağlaması gerekir.
Depolar ve dağıtım merkezleri, fiziksel dünyadaki yapay zeka modelleri için ideal bir öğrenme ortamıdır. Herhangi bir anda herhangi bir tesisten yüz binlerce hatta milyonlarca farklı stok tutma biriminin (SKU) akması yaygındır – bu da “robotik için GPT “yi eğitmek için gereken büyük, özel ve yüksek kaliteli veri kümesini sağlar.
Yapay zeka robotik “GPT anı” yakın
Robotik temel modellerinin büyüme yörüngesi çok hızlı bir şekilde ivme kazanıyor. Robotik uygulamalar, özellikle de hassas nesne manipülasyonu gerektiren görevlerde, gerçek dünyadaki üretim ortamlarında halihazırda uygulanmaktadır ve 2024 yılında ticari olarak uygulanabilir robotik uygulamaların katlanarak arttığını göreceğiz.
Chen, en iyi küresel yapay zeka ve makine öğrenimi dergilerinde yer alan 30’dan fazla akademik makale yayınlamıştır.
Kaynak: *Peter Chen / Techcrunch
* Peter Chen, dünyanın önde gelen yapay zeka robotik şirketi Covariant‘ın CEO’su ve kurucu ortağıdır. Covariant’ı kurmadan önce Peter, OpenAI’de araştırma bilimcisi ve Berkeley Yapay Zeka Araştırma (BAIR) Laboratuvarı’nda araştırmacı olarak görev yaptı ve burada takviyeli öğrenme, meta-öğrenme ve denetimsiz öğrenmeye odaklandı.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.