9.6 C
İstanbul

Alibaba’nın QwQ modeli, gelişmiş muhakeme yetenekleriyle OpenAI o1’e rakip oluyor

Alibaba, mantıksal akıl yürütme ve problem çözme gibi belirli ölçütlerde OpenAI'nin o1 modellerini geride bırakan 32,5 milyar parametreli yeni bir yapay zeka modeli olan QwQ-32B-Preview'u tanıttı.

Mutlaka Okumalısın

Alibaba, mantıksal muhakeme ve problem çözme yeteneklerine odaklanan yeni bir AI modeli olan QwQ-32B-Preview’u yayınladı. Model, belirli alanlarda OpenAI’nin en son teklifleriyle eşleşiyor ve bazen onları geride bırakıyor gibi görünüyor.

Çinli teknoloji devinin yapay zeka ekibi Qwen, yeni dil modelinin 32,5 milyar parametre içerdiğini ve 32.000’e kadar bağlam sözcüğünü işleyebileceğini söylüyor. QwQ-32B-Preview, AIME ve MATH gibi matematiksel testlerde özellikle güçlü sonuçlar gösteriyor ve MATH-500 ve GPQA kıyaslamalarında dikkate değer performans gösteriyor.

QwQ, mantık kıyaslamalarında OpenAI’nin o1-preview’unu yakalıyor ve hatta bazen aşıyor. | Resim: Qwen

Kendini kontrol etme yetenekleri

OpenAI’nin o1 modelleri gibi , QwQ da bir öz doğrulama sistemi içerir. Cevaplarını önceden planlar ve çalışmalarını iki kez kontrol eder, bu işlem işlem süresini artırır ancak aynı zamanda tipik dil modellerine kıyasla doğruluğu da artırır. Qwen ekibi bu özellik hakkında felsefi bir bakış açısına sahiptir:

QwQ o kadim felsefi ruhu temsil ediyor: Hiçbir şey bilmediğini biliyor ve merakını yönlendiren şey tam da bu. Herhangi bir cevaba karar vermeden önce, kendi varsayımlarını sorgulayarak, farklı düşünce yollarını keşfederek, her zaman daha derin bir gerçeği arayarak içe dönüyor. Yine de, bilgelik arayan herkes gibi, QwQ’nun da sınırlamaları var. Bu versiyon, daha uzun bir yolculuğun sadece erken bir adımı – hala akıl yürütme yolunda yürümeyi öğrenen bir öğrenci. Düşünceleri bazen dolaşıyor, cevapları her zaman eksiksiz değil ve bilgeliği hala büyüyor. Ama gerçek öğrenmenin güzelliği bu değil mi? Hem yetenekli hem de mütevazı olmak, bilgili ama her zaman sorgulayan olmak?

Qwen araştırma ekibi

Araştırmacılar bazı eksiklikleri kabul ediyorlar. QwQ bazen beklenmedik şekilde dil değiştirebilir, döngülerde takılıp kalabilir ve mantık odaklı dil modelleri için yaygın tuzaklar olan sağduyulu akıl yürütmede tökezleyebilir.

İLGİLİ YAZI :   OpenAI CEO'su Altman Grok ile alay etti, Musk GPT-4'le üretilen hakaretlerle karşılık verdi

Apache 2.0 lisansı altında yayınlanan QwQ, ticari kullanıma açıktır. Ancak Alibaba yalnızca belirli bileşenleri yayınladı ve bu da şimdilik tam çoğaltmayı imkansız hale getiriyor. Bir demo Hugging Face’te mevcuttur.

Alibaba’nın bulut bilişim birimi, ilk Qwen modellerini Ağustos 2023’te tanıttı. Daha güçlü bir halef olan Qwen2, kısa süre sonra programlama, matematik, mantık ve çok dillilik yeteneklerinde iyileştirmelerle takip edildi.

Mevcut Qwen 2.5 serisi, genel dil için Qwen2.5, programlama için Qwen2.5-Coder ve Qwen2.5-Math olmak üzere özel sürümler içeriyor. Daha büyük bağlam pencereleri için tasarlanan Qwen2.5-Turbo ise yakın zamanda eklendi.

Çin’in Artan Yapay Zeka Varlığı

QwQ, Çin’den çıkan ikinci “akıl yürütme modeli”dir. DeepSeek yakın zamanda OpenAI’nin tekliflerine meydan okuyacak gibi görünen benzer bir sistemi tanıttı. Her ikisi de şu anda yalnızca “mini” veya önizleme sürümleri olarak mevcut olsa da, tam sürümler bu yılın ilerleyen zamanlarında gelebilir.

Bu iki Çin modelinin OpenAI’nin o1 tanıtımından sadece birkaç hafta sonra gelmesi, OpenAI’nin rekabet avantajı hakkında ilginç sorular ortaya çıkarıyor. Ancak, OpenAI’nin o1 modelinin tam yetenekleri, özellikle hesaplama ölçekleme potansiyeli açısından henüz açıklanmadı. Bu modellerde gözle görünenin ötesinde daha fazlası olabilir ve mimari farklılıklar OpenAI’ye yine de belirgin bir avantaj sağlayabilir.


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler