13.2 C
İstanbul

Microsoft, gelişmiş yapay zeka geliştirmek için açık kaynaklı Phi-3.5 modellerini başlattı

Microsoft, Phi-3.5 serisinde üç yeni açık kaynaklı AI modeli başlattı: Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct ve Phi-3.5-vision-instruct. İzin verici bir MIT lisansı altında sunulan bu modeller, geliştiricilere muhakeme, çok dilli işleme ve görüntü ve video analizi dahil olmak üzere çeşitli görevler için araçlar sunuyor.

Mutlaka Okumalısın

Microsoft, Phi-3.5 serisinde üç yeni açık kaynaklı AI modeli başlattı: Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct ve Phi-3.5-vision-instruct. İzin verici bir MIT lisansı altında sunulan bu modeller, geliştiricilere muhakeme, çok dilli işleme ve görüntü ve video analizi dahil olmak üzere çeşitli görevler için araçlar sunuyor.

3,82 milyar parametreye sahip Phi-3.5-mini-instruct modeli, temel ve hızlı muhakeme görevleri için optimize edildi. Bellek ve hesaplama kısıtlı ortamlarda çalışacak şekilde tasarlandı; bu da onu kod oluşturma, matematiksel problem çözme ve mantık tabanlı muhakeme görevleri için uygun hale getiriyor. Nispeten kompakt boyutuna rağmen Phi-3.5-mini-instruct, uzun bağlamlı kod anlayışını ölçen RepoQA gibi kıyaslamalarda Meta’nın Llama-3.1-8B-instruct ve Mistral-7B-instruct gibi daha büyük modellerden daha iyi performans gösteriyor.

41,9 milyar parametreye sahip Phi-3.5-MoE-instruct modeli, uzmanların karışımı mimarisini kullanıyor. Bu, girdiye bağlı olarak farklı parametreleri etkinleştirerek daha karmaşık muhakeme görevlerini ele almasını sağlıyor. MoE modeli, Google’ın Gemini 1.5 Flash’ı da dahil olmak üzere çeşitli ölçütlerde daha büyük muadillerinden daha iyi performans göstererek gelişmiş muhakeme yeteneklerini gösteriyor. Bu, onu derin, bağlam farkında anlayış ve karar verme gerektiren uygulamalar için güçlü bir araç haline getiriyor.

4,15 milyar parametreye sahip Phi-3.5-vision-instruct modeli, hem metin hem de görüntü işleme yeteneklerini birleştiriyor. Bu çok modlu yaklaşım, görüntü anlama, optik karakter tanıma ve video özetleme dahil olmak üzere çeşitli görevleri ele almasını sağlıyor. 128K belirteç bağlam uzunluğu desteği sayesinde karmaşık, çok çerçeveli görsel görevleri ele almada özellikle usta. Sentetik ve herkese açık veri kümelerinin bir kombinasyonu üzerinde eğitilen Phi-3.5-vision-instruct modeli, TextVQA ve ScienceQA gibi görevlerde uzmanlaşarak yüksek kaliteli görsel analiz sağlıyor.

Phi-3.5 serisindeki üç modelin de güçlü eğitim geçmişleri var. Phi-3.5-mini-instruct, 10 gün boyunca 512 H100-80G GPU kullanılarak 3,4 trilyon jeton üzerinde eğitildi. Phi-3.5-MoE-instruct modeli, aynı sayıda GPU ile 23 gün boyunca 4,9 trilyon jetonu işleyerek daha kapsamlı bir eğitim süreci gerektirdi. Phi-3.5-vision-instruct modeli, altı gün boyunca 256 A100-80G GPU kullanılarak 500 milyar jeton üzerinde eğitildi. Bu kapsamlı eğitim süreçleri, Phi-3.5 modellerinin çok sayıda kıyaslamada yüksek performans elde etmesini sağladı ve genellikle OpenAI’nin GPT-4o’su da dahil olmak üzere birçok senaryoda diğer önde gelen AI modellerini aştı.

İLGİLİ YAZI :   Volkswagen üretken yapay zeka teknolojisini gelecek elektrikli araçlara entegre edecek
Phi-3.5 mini-instruct ve diğer önde gelen AI modellerinin kıyaslama karşılaştırması (Kaynak: Hugging Face)

Bu kıyaslama sonuçları, Phi-3.5 modellerinin, özellikle Phi-3.5 mini’nin, farklı görevlerde Mistral, Llama ve Gemini gibi diğer önde gelen AI modelleriyle nasıl karşılaştırıldığını gösteriyor. Veriler, Phi-3.5 modellerinin genel muhakemeden daha spesifik problem çözme senaryolarına kadar uzanan görevlerdeki etkinliğini vurguluyor.

Yapay zeka topluluğundan gelen tepkiler, Phi-3.5 serisinin teknik yeteneklerini, özellikle çok dilli ve görüntü görevlerinde vurguladı. Sosyal medya platformlarında kullanıcılar, modellerin kıyaslamalardaki performansını not ettiler ve potansiyel uygulamalarına ilgi gösterdiler. Örneğin, Turan Jafarzade PhD LinkedIn’de şu yorumu yaptı :

Bu avantajlar, Phi-3.5 SLM’yi (küçük dil modeli), verimliliğin ve ölçeklenebilirliğin kritik olduğu kurumsal uygulamalar için rekabetçi bir model olarak konumlandırıyor.

Danny Penrose şunları ekledi :

Etkileyici bir gelişme! Phi-3.5’i performans kaybı olmadan Llama mimarisine dönüştürme yeteneği, model optimizasyonu için bazı heyecan verici olasılıklar sunuyor. Bunun gerçek dünya uygulamalarında bu modellerin daha geniş çapta benimsenmesini nasıl etkileyeceğini düşünüyorsunuz?

Phi-3.5 modelleri, geliştiricilerin yazılımı hem ticari hem de ticari olmayan amaçlar için özgürce kullanmalarına, değiştirmelerine ve dağıtmalarına olanak tanıyan MIT lisansı altında yayınlandı. Bu lisans, yapay zeka yeteneklerinin çeşitli uygulamalara ve projelere entegre edilmesini kolaylaştırmayı ve farklı endüstrilerde çok çeşitli kullanım durumlarını desteklemeyi amaçlıyor.

Kaynak: Robert Krzaczynski / Infoq.com


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler