22.5 C
İstanbul

Meta, Temmuz sonunda en büyük Llama modelini piyasaya sürecek

Meta Platforms, açık kaynaklı dil modeli Llama 3'ün 405 milyar parametreye sahip en büyük sürümünü 23 Temmuz'da yayınlamayı planlıyor. Model çok modlu olacak ve hem görüntüleri hem de metinleri işleyebilecek.

Mutlaka Okumalısın

Bir çalışana göre Meta Platforms, açık kaynaklı dil modeli Llama 3’ün en büyük sürümünü 23 Temmuz’da yayınlamayı planlıyor.

The Information’ın haberine göre, 405 milyar parametreli model çok modlu olacak ve hem görüntüleri hem de metinleri işleyebilecek. Bu, modelin örneğin görüntü ve metin kombinasyonundan yeni görüntüler oluşturabileceği anlamına geliyor.

Önceki Lama modelleri metin üretimiyle sınırlıydı. Meta’nın 400 milyarlık modelin ağırlıklarını kullanıma sunmayacağına dair söylentiler vardı. Yapay zeka sızdırıcısı Jimmy Apples, X’te Facebook’un kurucu ortağı Dustin Moskovitz’in Mark Zuckerberg’e yaptığı iddia edilen itirazları bildirdi.

Jimmy Apples’a göre, bu itirazlara rağmen Meta “görünüşe göre bu güncelleme anında” ağırlıklar da dahil olmak üzere modeli açık kaynak olarak yayınlamaya karar verdi.

Ağırlıkların yayınlanmasına karşı finansal nedenler (model eğitimi pahalı) ve güvenlik nedenleri var. Ağırlıklar sayesinde, açık kaynaklı modelin daha fazla kişi tarafından doğrudan kullanılması kolaylaşır ve bu da güvenlik açısından eleştirilebilir.

Yapay zeka modellerindeki ağırlıklar, tahminleri optimize etmek için anahtar parametrelerdir. Bunların açık kaynaklı modellerde yayınlanması tekrarlanabilirliği mümkün kılar ve pratik uygulama, şeffaflık ve karşılaştırılabilirliği kolaylaştırır. Geliştiriciler ağırlıklar olmadan önceden eğitilmiş bir modeli indirdiklerinde, yalnızca modelin mimarisini, tabiri caizse “boş kabuğunu” alırlar.

Bu mimari, sinir ağının yapısını tanımlar; kaç katmana sahip olduğu, nasıl bağlandıkları vb. Öğrenme süreci sırasında optimize edilen ağırlıklar olmadan model anlamlı tahminler yapamaz veya görevleri çözemez.

Modelin boyutuna ve veri miktarına bağlı olarak, eğitim süreci zaman alıcı ve yoğun kaynak gerektirebilir. Ağırlıklara erişim, büyük eğitim yetenekleri olmayan geliştiricilerin gelişmiş yapay zeka modellerini kullanmasına ve geliştirmesine olanak tanır.

Açık kaynaklı YZ topluluğunda ağırlıkların bu kadar önemli olmasının ve rağbet görmesinin nedeni budur.


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

İLGİLİ YAZI :   Oxford araştırmacıları, doktorların tıbbi görüntüleri analiz etme şeklini değiştirebilecek bir yapay zeka olan MedSAM-2'yi tanıttı
- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler