Google, yapay zeka modelleri serisinde önemli bir güncelleme olan Gemini 1.5’i tanıttı. Ana özelliği, daha önce görülmemiş derecede büyük bir token bağlam uzunluğu sunması.
Google’a göre Gemini 1.5, eğitmeyi ve dağıtmayı daha verimli hale getiren yeni bir Uzmanlar Karışımı (MoE – Mixture-of-Experts) mimarisine sahip. Google DeepMind CEO’su Demis Hassabis, bu son neslin ilk modeli olan Gemini 1.5 Pro’nun Gemini 1.0 Ultra ile karşılaştırılabilir performans sunduğunu, ancak daha az bilgi işlem gücü gerektirdiğini belirtti.
Gemini 1.5’in en çığır açan özelliği uzun bağlam penceresi. Piyasaya sürülecek ilk model olan Gemini 1.5 Pro, 128.000 jetonluk standart bir bağlam penceresi ile birlikte geliyor. Bununla birlikte, sınırlı bir grup geliştirici ve kurumsal müşteri, 1 milyon jetona kadar işleyebilen bir sürüme erken erişime sahip olacak. Google’a göre bu, örneğin bir saatlik video, 11 saatlik ses, 30.000’den fazla satıra sahip kod tabanları veya 700.000’den fazla kelimeye sahip belgeler gibi büyük veri dizilerini işlemesini sağlayacak. OpenAI’nin GPT-4 Turbo’su 128.000 simgeye ve Anthropics Claude 2.1 200.000 simgeye sahip. Google’ın araştırması, modeli 10 milyona kadar belirteçle test ederek büyük miktarda bilgiyi etkili bir şekilde yönetme yeteneğini ortaya koydu.
“Samanlıkta iğne aramak” testinde Gemini 1.5 Pro, 1 milyon token’a kadar olan veri bloklarında hedef metni %99 oranında bularak “ortada kaybolma” fenomenini ortadan kaldırdı. Örneğin, neredeyse bir günlük ses kaydında gizli anahtar kelimeleri bulmada mükemmel doğruluk elde etti. Google’ın Gemini Ekibi teknik raporda ayrıca üç saatlik bir video içindeki rastgele karelerden de etkili bir şekilde bilgi alabildiğini belirtti.
Gemini 1.5 Pro, Gemini 1.0 Ultra’ya yaklaşıyor
Gemini 1.5 Pro’nun temel yetenekleri metin, kod, görüntü, video ve ses modalitelerinde çok çeşitli kıyaslamalara uzanıyor. Google, Gemini 1.5 Pro’nun Gemini 1.0 Pro’ya göre %87,1, Gemini 1.0 Ultra’ya göre ise %54,8’lik bir kazanma oranına sahip olduğunu 31 kıyaslamaya dayanarak belirtiyor. Yeni model Matematik, Bilim ve Akıl Yürütme, Çok Dillilik, Video Anlama ve Kodlama dahil olmak üzere çeşitli alanlarda iyileştirmeler gösterdi.
Geliştiriciler ve kurumsal müşteriler, AI Studio ve Vertex AI aracılığıyla Gemini 1.5 Pro’nun sınırlı bir önizlemesine erişebilirler. Google bu önizlemeyi test aşamasında ücretsiz olarak sunuyor, ancak kullanıcılar deneysel özellik ile daha uzun gecikme süreleri beklemelidir. Google gelecekte modelin bağlam penceresinin boyutuna göre fiyatlandırma kademeleri sunmayı planlıyor.
Google DeepMinds Baş Bilim İnsanı Jeff Dean, “Model daha geniş bir sürüm için hazır olduğunda standart 128.000 token bağlam penceresine sahip 1.5 Pro’yu da tanıtacağız. Çok yakında, modeli geliştirdikçe standart 128.000 bağlam penceresinden başlayan ve 1 milyon token’a kadar ölçeklenen fiyatlandırma kademeleri sunmayı planlıyoruz” dedi.
Google, Gemini 1.5 model ailesinin doğruluğunu ve performansını deneysel modellerde 1 milyon hatta 10 milyon token bağlam penceresiyle koruyabilirse, bu ve bunu takip edecek diğer modeller bilim ve diğer alanlarda çok modlu modeller için yeni uygulamalar sağlayacak. Bu aynı zamanda Google’ın Gemini ailesini oldukça hızlı bir şekilde yineleyebileceğini ve Google ile OpenAI ve Microsoft arasındaki yarışın daha yeni başladığını gösteriyor.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.