DeepSeek etkileyici yeni açık kaynak yapay zeka modellerini tanıttı

Çinli yapay zeka girişimi DeepSeek AI, son teknoloji ürünü büyük dil modelleri ailesi DeepSeek LLM’yi açık kaynaklı olarak tanıttı. Bu aile DeepSeek LLM 7B/67B Base ve DeepSeek LLM 7B/67B Chat’i içeriyor.

DeepSeek LLM’nin 67B Base sürümü, özellikle akıl yürütme, kodlama, matematik ve Çince anlama gibi alanlarda Llama2 70B Base’e kıyasla üstün performans gösterdi.

DeepSeek LLM 67B Base, akıl yürütme, kodlama, matematik ve Çince anlama gibi alanlarda Llama2 70B Base’den daha iyi performans gösteriyor.

Bu ilerleme sadece niceliksel bir sıçrama değil, aynı zamanda modelin geniş bir uygulama yelpazesindeki yeterliliğini gösteren niteliksel bir sıçrama. Özellikle, DeepSeek Chat kodlama ölçütü HumanEval’de %73,78’lik bir geçiş oranına ulaşarak eşdeğer büyüklükteki modellerden daha iyi performans gösterdi. Ayrıca matematik veri kümesi GSM8K üzerinde herhangi bir ince ayar yapmadan %84,1 gibi olağanüstü bir başarı elde etti.

DeepSeek AI, hem İngilizce hem de Çince dillerinde çeşitli kıyaslamalar kullanarak modellerinin kapsamlı değerlendirmelerini yaptı.

DeepSeek AI, temel ve özel sohbet varyantları da dahil olmak üzere modelinin hem 7 milyar hem de 67 milyar parametreli versiyonlarını açık kaynaklı hale getirdi. Şirket bu modellere açık erişim sağlayarak daha geniş çaplı yapay zeka araştırmaları ve ticari uygulamalara olanak sağlamayı umuyor.

DeepSeek AI, tarafsız performans değerlendirmesini sağlamak için Macaristan Ulusal Lise Sınavı ve Google’ın değerlendirme veri setini takip eden talimatı da dahil olmak üzere yeni problem setleri tasarladı. Bu değerlendirmeler, modelin daha önce görülmemiş sınav ve görevlerdeki olağanüstü yeteneklerini ortaya koydu.

Macaristan Ulusal Lise Sınavı kullanılarak matematiksel yeteneklerin değerlendirilmesi.

Girişim, telif haklarına saygı gösterirken çeşitliliği ve benzersizliği artırmaya odaklanan titiz veri toplama ve eğitim sürecine ilişkin ayrıntıları özetledi. Çok adımlı boru hattı kaliteli metin, matematik, kod, kitap ve diğer verileri alıyor, toksisite ve kopyaları gidermek için filtreleme uyguluyor.

DeepSeek’in LLaMA’ya benzer mimarileri benimseyen dil modelleri yoğun bir ön eğitimden geçirildi. 7B modeli Çok Kafalı dikkati kullanırken, 67B modeli Gruplandırılmış Sorgu Dikkatinden yararlandı. Eğitim süreci, sağlam ve verimli öğrenmeyi sağlamak için büyük yığın boyutları ve çok adımlı bir öğrenme hızı programı içeriyordu.

İLGİLİ YAZI : Şirket yöneticilerinin yüzde 91'i üretken yapay zekanın verimliliği artırabileceğine inanıyor

Kullanıcılar DeepSeek Chat ve DeepSeek coder’a ChatGPT veya Claude benzeri bir web arayüzü üzerinden erişebilirler. Bununla birlikte, Çin düzenlemelerini karşılamak için DeepSeek tarafından sağlanan web tabanlı sohbet robotunun belirli sorgulama alanlarını sınırlayan sansür içerdiğini unutmayın. Bu, insan geri bildirimi yoluyla pekiştirmeli öğrenme yoluyla sağlanan güvenlik önlemlerinden farklıdır.

Sohbet robotu belirli sorguları geriye dönük olarak silecek.

Neyse ki bu sansür gerçek modellerde değil, sadece https://chat.deepseek.com/ adresindeki web deneyiminde mevcut gibi görünüyor.

Ollama kullanarak DeepSeek LLM’yi yerel olarak çalıştırma örneği. Sansür olmadığını unutmayın.

DeepSeek’in sürümleri, hem araştırmacılar hem de uygulayıcılar için heyecan verici olanaklar sunarak YZ topluluğu için yeni bir standart belirliyor. Bu açık kaynak girişimi, DeepSeek AI’nın alanı ilerletme konusundaki kararlılığını göstermekle kalmıyor, aynı zamanda AI topluluğunun daha sofistike ve yetenekli dil modelleri için devam eden arayışına önemli katkılar vaat ediyor.

Kaynak: Chris Mckay / Maginative

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn ve Instagram‘da takip edin.

Çinli startup DeepSeek etkileyici yeni açık kaynak yapay zeka modellerini tanıttı

Mutlaka Okumalısın

Kısıtlamalar nedeniyle ağlar kapandıkça yapay zekalı kazıyıcıların alanı tükeniyor

Cohere, 5,5 milyar dolarlık değerlemeyle 500 milyon dolar topladı

Çinli şirketler ölen sevdiklerini yapay zeka avatarlarıyla ‘diriltmeyi’ teklif ediyor

Streetscapes AI, sıfırdan tüm şehirlerin inanılmaz derecede gerçekçi Sokak Görünümü sahnelerini oluşturuyor

Daha Fazla

CEVAP VER İptal

Son Haberler

Kısıtlamalar nedeniyle ağlar kapandıkça yapay zekalı kazıyıcıların alanı tükeniyor

Cohere, 5,5 milyar dolarlık değerlemeyle 500 milyon dolar topladı

Çinli şirketler ölen sevdiklerini yapay zeka avatarlarıyla ‘diriltmeyi’ teklif ediyor

Streetscapes AI, sıfırdan tüm şehirlerin inanılmaz derecede gerçekçi Sokak Görünümü sahnelerini oluşturuyor

‘Yapay zeka arama motorları demokrasiye geri dönülemez şekilde zarar verebilir’

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Kısıtlamalar nedeniyle ağlar kapandıkça yapay zekalı kazıyıcıların alanı tükeniyor

Cohere, 5,5 milyar dolarlık değerlemeyle 500 milyon dolar topladı