22.5 C
İstanbul

Mistral, matematik, kod ve genel görevler için üç yeni LLM programı yayınladı

Fransız yapay zeka girişimi Mistral AI, matematiksel akıl yürütme için 7 milyar parametreye sahip Mathstral, yeni Mamba2 mimarisine sahip Codestral Mamba ve 12 milyar parametreye sahip Mistral NeMo olmak üzere iki özel dil modeli ve bir genel dil modeli yayınladı.

Mutlaka Okumalısın

Mistral AI bu hafta, genel amaçlı görevler ve matematiksel akıl yürütme ve kod üretimi gibi uzmanlık alanları için yeni ölçütler belirleyen üç yeni LLM programını tanıttı.

Mathstral: Matematik görevleri için 7 Milyar Parametre

7 milyar parametreli bir model olan Mathstral, Fransız girişimin, matematikte insan ve yapay zekayı ilerletmeye odaklanan kar amacı gütmeyen bir kuruluş olan Project Numina ile iş birliği içinde geliştirdiği bir model. MATH (%56,6) gibi matematiksel ölçütlerde ve MMLU (%63,47) gibi genel ölçütlerde benzer büyüklükteki modellerden daha iyi performans gösteriyor.

Mistral ekibi, özel olarak üretilen modellerde performans ve hızı dengeleme tasarım felsefelerinin bir örneği olarak Mathstral’ı gösterdi.

Codestral Mamba: Daha büyük bağlam penceresine sahip yeni mimari

22 milyar parametreli bir kod modeli olan Codestral’ın Mayıs 2024’te yayınlanmasının ardından Mistral, Codestral Mamba’yı tanıttı. Bu yeni model , 256.000 token’a kadar bağlam pencereleriyle hızlı kod üretimi sunan Mamba2 mimarisini kullanıyor.

Bu, kendi kod tabanınızı ve programlama çerçevelerinden gelen dokümantasyonu tek bir komut istemine aktarabildiğiniz için onu yerel bir kod asistanı olarak ideal hale getiriyor. Codestral Mamba, dizileri doğrusal zamanda işler, daha hızlı yanıtlar ve teorik olarak sonsuz çıktı uzunlukları sağlıyor.

Benzer büyüklükteki modellerden daha iyi performans göstermesine rağmen, Transformer tabanlı daha büyük Codestral hala çoğu alanda önde gidiyor.

Mistral henüz eğitim verileri ve model mimarileri hakkında daha fazla bilgi sağlayan teknik dokümantasyonu yayınlamadı. Ancak, ağırlıklar Hugging Face’te (Mathstral, Codestral Mamba) mevcut.

İLGİLİ YAZI :   Midjourney 'donanım sektörüne girdiğini' duyurdu

Mistral NeMo: Mistral-7B’nin yerine mi geçecek?

NVIDIA ile geliştirilen Mistral NeMo, 12 milyar parametre ve 128.000’e kadar token’lık bir bağlam penceresine sahiptir. Mantık, dünya bilgisi ve kodlama yeteneklerinde mükemmeldir ve bu da onu küresel, çok dilli uygulamalar için uygun hale getiriyor.

Mistral NeMo, mevcut sistemlere kolay entegrasyon sağlayan standart bir mimariye dayanıyor. Gemma-2-9B ve LLaMA-3-8B gibi diğer açık kaynaklı modellerle karşılaştırıldığında, NeMo temel modeli, 16 kat daha büyük bir bağlam penceresini desteklerken kıyaslamalarda benzer veya daha iyi sonuçlar gösteriyor.

Model, 100’den fazla dil için optimize edilmiş Tekken adlı yeni bir belirteçleyici ile eğitildi ve bu, daha önce kullanılan SentencePiece belirteçleyicisine göre daha fazla doğal metin ve kaynak kodu sıkıştırma olanağı sağlıyor.

LLaMA 3 tokenizer ile karşılaştırıldığında Tekken, dillerin %85’i için daha verimli sıkıştırma sunar. Mistral NeMo, özellikle İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Çince, Japonca, Korece, Arapça ve Hintçe gibi dillerde güçlü.

Mistral, araştırmacılar ve şirketler tarafından benimsenmesini teşvik etmek için Apache 2.0 lisansı altında önceden eğitilmiş temel ve talimat optimize edilmiş kontrol noktalarını yayınladı. NeMo, Mayıs ayında bir güncelleme alan Mistral-7B’nin izinden gidiyor gibi görünüyor .

Mistral, Avrupa’nın en iyi LLM girişimi olmaya devam ediyor

Mistral AI, Avrupa’nın en iyi LLM girişimi olarak liderliğini sürdürüyor. Şirket, bu yılın başlarında OpenAI’nin GPT-4’üyle rekabet etmek için Mistral Large’ı piyasaya sürdü . Şirket, Şubat ayında Microsoft ile çok yıllık bir ortaklık kurdu ve Haziran ayında 600 milyon dolar topladı.

Mistral AI, genel olarak Avrupa standartlarına uygun şeffaflık ve veri koruma gibi unsurları da dikkate alan yetenekli ve uzmanlaşmış AI modelleri geliştirerek kendini önde gelen bir Avrupa AI şirketi olarak konumlandırıyor.

İLGİLİ YAZI :   Google Cloud ve Hugging Face açık kaynaklı yapay zekayı geliştirmek için güçlerini birleştirdi

Avrupa’nın LLM sektöründe ise henüz model seviyesinde Mistral’ı yakalayamayan Aleph Alpha , 300 milyon dolar destekle kurumlar için yapay zeka dil çözümlerini genişletmek isteyen DeepL ve yakın zamanda AMD tarafından satın alınan Silo AI yer alıyor.


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler