Yeni bir proje aralarında Türkçe’nin de bulunduğu 45 Avrupa dilini tek bir modelde birleştirmeyi amaçlıyor. Fraunhofer IAIS (Institute for Intelligent Analysis and Information Systems / Akıllı Analiz ve Bilgi Sistemleri Enstitüsü) ve AI İsveç’e göre EuroLingua artık Barselona’daki bir süper bilgisayarda ihtiyaç duyduğu hesaplama gücünü elde ediyor.
İki kuruluş, Avrupa Yüksek Performanslı Hesaplama Ortak Girişimi’nden (EuroHPC JU) Barselona Süper Hesaplama Merkezi’ndeki yeni MareNostrum 5 süper bilgisayarında hesaplama süresi elde etti. Bu, EuroHPC altyapısında büyük Avrupa dil modelleri geliştirmek için şimdiye kadar verilen en büyük altyapılardan biri.
180 milyara kadar parametreye sahip AB yapay zeka modelleri
Mayıs 2024’ün sonlarından itibaren ortaklar, bir yıl sürecek “EuroLingua-GPT” projesinin bir parçası olarak ilk çok dilli modelleri eğitmeye başlayacaklar.
Nvidia’nın H100 çipleri üzerinde 8.8 milyon GPU saati ayıran ortaklar, 7 ila 34 milyar parametre arasında değişen küçük modelleri ve 180 milyara kadar parametreye sahip büyük modelleri sıfırdan eğitebilecekler. İlk modeller önümüzdeki aylarda açık kaynak olarak kullanıma sunulacak.
EuroLingua modelleri, 24 resmi Avrupa dili de dahil olmak üzere aralarında Türkçe’nin de bulunduğu 45 Avrupa dili, lehçesi ve kodundan oluşan bir eğitim veri setine dayanıyor. Çok dilli yapay zeka dil modelleri hala nadir olduğu için bu, Avrupa dillerine ve değerlerine büyük bir odaklanma getiriyor.
Bu bilgi işlem kapasiteleri Almanya ve Avrupa için bir dönüm noktası. Bununla eğitilen modeller, üretken yapay zekanın şirketlerde kullanımını büyük ölçüde hızlandıracak ve hem iş dünyasına hem de bilime ivme kazandıracak – GenAI ‘made in Europe’ böylece gerçeğe dönüşüyor-
Joachim Köhler, Fraunhofer IAIS NetMedia Bölüm Başkanı
Fraunhofer IAIS ve AI Sweden bu proje için bilgi birikimlerini bir araya getiriyor. Fraunhofer IAIS, Alman Federal Ekonomi Bakanlığı tarafından finanse edilen ve aynı zamanda büyük Avrupa çok dilli açık kaynak modelleri geliştiren OpenGPT-X projesine liderlik ediyor. AI İsveç’teki NLU (Doğal Dil Anlama) grubu, İskandinav dilleri için GPT-SW3 LLM’yi geliştiriyor.
Büyük genelciler ve küçük uzmanlar
EuroLingua-GPT, Fraunhofer IAIS ve AI Sweden’ın TrustLLM ve Deploy AI ile birlikte dahil olduğu dil modelleri üzerine devam eden üç büyük AB projesinden biri.
EuroHPC kurulumunda geliştirilen modellerin genel olarak araştırma ve bilime yardımcı olması amaçlanıyor ve daha sonra ortak transfer projeleri aracılığıyla şirketlerde veya kamu ofislerinde üretken kullanım için özelleştirilecekler.
İsveç’in yanı sıra Finlandiya da Avrupa için açık kaynaklı dil modelleri üzerinde çalışıyor. Silo AI tarafından geliştirilen Poro buna bir örnek. Bununla birlikte, güçlü bir çok dilli model hala çok uzakta.
Fransız yapay zeka girişimi Mistral, Mixtral ile büyük bir ilerleme kaydetti, ancak Avrupa’daki kıyaslamalarda yalnızca Fransızca, İtalyanca, Almanca ve İspanyolca dillerinde diğer açık modellerden daha iyi performans gösteriyor. Yani daha gidilecek çok dil var.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.