Meta, açık kaynaklı Llama dil modeli serisinin bugüne kadarki en büyük modeli olan Llama 3.1 405B’yi yayınladı. Bu model, 405 milyar parametreye sahip.
Tüm Llama 3 ailesi de 3.1 sürümüne güncellendi ve bu sayede sekiz dil desteği ve Nisan ayında yayınlanan Llama 3 modellerine kıyasla önemli ölçüde genişletilmiş 128.000 tokenlik bir bağlam uzunluğu sağlandı.
Meta’ya göre, Llama 3.1 405B ilk açık kaynaklı sınır seviyesi AI modelidir. Genel ölçütlerde, hem İngilizce dil görevlerinde hem de birden fazla dil bilgisi gerektiren görevlerde GPT-4o ve GPT-4’ün önceki bir sürümünü geride bırakıyor. Ayrıca Anthropic’in Claude 3.5 Sonnet’ine benzer bir seviyede.
70 ve 8 milyar parametreli daha küçük 3.1 Llama modelleri, 405B modeli tarafından üretilen veriler kullanılarak optimize edildi ve en azından karşılaştırılabilir açık kaynaklı modeller ve yakın zamanda çok daha güçlü ve daha ucuz GPT-4o mini ile değiştirilen GPT-3.5 Turbo ile aynı seviyede.
Bu kıyaslama sonuçları Llama 3 405B’nin genel olarak ticari modellerle aynı seviyede olduğunu gösteriyor olsa da gerçek dünyadaki performansı farklılık gösterebilir.
Meta ayrıca sürümle birlikte giriş ve çıkış denetimi için Llama Guard 3, anında enjeksiyon koruması için Prompt Guard ve siber güvenlik risk değerlendirmesi için CyberSecEval 3 gibi yeni güvenlik araçlarını da tanıtıyor.
Meta, Llama lisansı altında ticari kullanıma izin veren kod ve ağırlıklarla en büyük Llama modelini yayınladı. Model rafine edilebilir, diğer modellere damıtılabilir ve nesilleri AI eğitimi için kullanılabilir. Meta, Llama 3’ü dağıtmak ve optimize etmek için kapsamlı bir ortak ekosistemi oluşturuyor.
Meta’dan ticari lisans yalnızca 700 milyondan fazla kullanıcısı olan şirketler için gerekli. Meta’nın AI modelini geliştirmek ve eğitmek için milyarlarca dolar yatırım yaptığı göz önüne alındığında, şirket bunu neden yapıyor?
Şirket, Google’ın Android’de yaptığı gibi, geliştiricileri kendi “AI ekosistemine” çekmeyi umuyor. Meta ayrıca modelleri kendi AI ürünlerine, örneğin “Meta AI” asistanına entegre ediyor. Topluluk modelleri geliştirdikçe Meta’nın ürünleri de gelişecek.
Meta ayrıca, daha iyi altyapıya ve bulut büyümesi gibi tamamlayıcı iş modellerine sahip oldukları için yapay zekada Meta’yı geçebilecek Microsoft, Google ve diğerlerinin iş modellerini kısmen baltalıyor. Ancak şu anda, OpenAI’yi ve daha genel olarak saf oyun modeli sağlayıcılarını en çok vuruyor.
Meta CEO’su Mark Zuckerberg, açık bir mektupta açık kaynaklı AI’nın lehine bir argüman sunuyor ve bunu kapalı Unix sistemlerine kıyasla Linux’un yükselişiyle karşılaştırıyor. Llama gibi açık modellerin, uyarlanabilirlikleri ve maliyet etkinlikleri nedeniyle gelecek yıldan itibaren sektöre öncülük edeceğini öngörüyor.
Mark Zuckerberg, “Geçtiğimiz yıl, Llama 2 yalnızca sınırın gerisindeki eski nesil modellerle kıyaslanabilirdi. Bu yıl, Llama 3 en gelişmiş modellerle rekabet ediyor ve bazı alanlarda lider. Önümüzdeki yıldan itibaren, gelecekteki Llama modellerinin sektördeki en gelişmiş modeller olmasını bekliyoruz” diye yazdı.
Llama 3’ün piyasaya sürülmesi, teknik olarak mümkünse OpenAI ve diğerlerini daha güçlü modellerle daha hızlı bir şekilde yakalamaya itebilir. Ancak, dil modellerindeki son gelişmeler artımlı oldu, maliyet ve verimlilik avantajlarını göz ardı etti ve Llama 3, AI endüstrisinin şu anki kutsal kasesine önemli ilerlemeler getirmiyor gibi görünüyor: Mantıksal akıl yürütmeyi büyük çok modlu modellerin bilgi ve dil yetenekleriyle birleştirmek.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.