Anthropic, üç versiyonu bulunan en yeni büyük dil modeli Claude 3’ü tanıttı. En güçlü versiyon olan “Opus”un en azından GPT-4 ile aynı seviyede olması bekleniyor.
The Decoder’ın haberine göre, OpenAI’nin bir yan kuruluşu olan yapay zeka girişimi Anthropic, çeşitli bilişsel görev alanlarında standartları belirlemek üzere tasarlanmış yeni bir yapay zeka sistemi serisi olan Claude 3 model ailesini tanıttı.
Aile üç modelden oluşmaktadır: Claude 3 Haiku, Claude 3 Sonnet ve Claude 3 Opus, kullanıcılara kendi özel uygulamaları için zeka, hız ve maliyet seçenekleri sunuyor. Opus, Claude 2.1 kadar hızlıdır, ancak çok daha “akıllı” olduğu söylenirken, Haiku neredeyse gerçek zamanlı olarak yanıt verebilir. Sonnet, Claude 2’den iki kat daha hızlı, ancak “daha yüksek zeka seviyelerine” sahip.
Anthropic’e göre, tüm Claude 3 modelleri gelişmiş analitik ve tahmin yetenekleri, incelikli içerik oluşturma, kod oluşturma ve İspanyolca, Japonca ve Fransızca gibi İngilizce olmayan dillerde konuşma imkanı sunuyor. Ayrıca fotoğraflar, çizelgeler, grafikler ve mühendislik çizimleri de dahil olmak üzere çeşitli görsel formatları işleyebiliyorlar.
Opus ve Sonnet şu anda claude.ai ve Claude API aracılığıyla kullanılabiliyor, Haiku ise yakında kullanıma sunulacak. Opus yalnızca ödeme yapan Claude müşterileri tarafından kullanılabilir, Sonnet ise ücretsizdir.
Claude 3 modellerinin ilgili rakip modellerden daha iyi performans göstermesi
Duyuruya göre Claude 3 modelleri, lisans düzeyinde uzmanlık (MMLU), lisansüstü düzeyde akıl yürütme (GPQA) ve temel matematik (GSM8K) gibi yaygın yapay zeka ölçütlerinde rakiplerinden daha iyi performans gösteriyor. Anthropic, Opus’un “karmaşık görevlerde insana yakın düzeyde kavrayış ve akıcılık” gösterebileceğini iddia ediyor.
Anthropic’e göre Claude 3 modelleri karmaşık talimatları takip edebilir ve JSON gibi formatlarda yapılandırılmış çıktılar üretebilir, bu da onları doğal dil sınıflandırması ve duygu analizi için uygun hale getirir.
Anthropic’in kıyaslamalarda GPT-4’ü yakalaması ve bazılarında geçmesi bir başarı olsa da, iki şey akılda tutulmalıdır: Birincisi, kıyaslamalar sadece bundan ibarettir. Modellerin gerçek dünyada ne kadar iyi performans göstereceği henüz belli değil. İkincisi, GPT-4 yaklaşık bir yıldır mevcut ve milyarlarca yatırım yapılmasına rağmen hala hiçbir şirket önemli bir ilerleme kaydetmeyi başaramadı.
Claude 3’ün gözleri var
Yeni Claude modelleri, fotoğraflar, diyagramlar ve teknik çizimler gibi farklı görüntü formatlarını işleyebilmelerini sağlayan görsel yeteneklere sahip. Anthropic, bunun özellikle bilgi tabanları çeşitli formatlarda kodlanmış kurumsal müşteriler için faydalı olacağını söylüyor.
Claude 3 modelleri ile Anthropic, gereksiz reddetmeleri azaltma ve istemlerin anlaşılmasını geliştirme konusunda da önemli ilerleme kaydettiğini iddia ediyor. Claude 2.1 ile karşılaştırıldığında, modellerin zorlu açık uçlu soruların doğruluğunu iki katına çıkardığı ve yanlış cevap sayısını azalttığı söyleniyor.
Bir milyon token kadar bağlam penceresi
Google Gemini 1.5’e benzer şekilde, Anthropic de Claude’daki bağlam penceresini önemli ölçüde genişletiyor. Bağlam penceresi, yapay zeka modelinin bir kerede işleyebileceği bilgi miktarını tanımlar. Claude 3 ile, modeller başlangıçta yalnızca 200K ile piyasaya sürülmesine rağmen, bir milyon jetona kadar girdi mümkündür. Karşılaştırma için, orijinal GPT-4 sadece 8K token’a, en yenisi ise 128K’ya sahiptir.
Bir modelin bilgileri doğru bir şekilde çıkarma yeteneğini ölçen Needle In A Haystack (NIAH) değerlendirmesi, Claude 3 Opus’un uzun belgelerden tek tek bilgi parçalarını yüzde 99’un üzerinde doğrulukla mükemmele yakın bir şekilde çıkardığını gösteriyor.
Google ayrıca NIAH testini Gemini 1.5’teki bağlam penceresinin performansını vurgulamak için bir ölçüt olarak kullandı. Ancak bu LLM arama biçimi, modelin bağlamı anlayıp anlamadığı ve büyük metinleri anlamlı bir şekilde özetleyip özetleyemediği veya analiz edip edemediği hakkında çok az şey söylüyor. Uygulamaya bağlı olarak, büyük metin verilerini aramanın daha etkili yolları vardır – örneğin, “Ctrl + F”.
Bu devasa içerik pencerelerinin bir maliyet faktöründen daha fazlası olup olmadığını göreceğiz. Risk, sistemi ne kadar çok içerikle beslerseniz, bir şeyi gözden kaçırdığını fark etme olasılığınızın o kadar azalmasıdır.
Bir milyon token için girdi ve çıktı maliyetleri en akıllı model olan Opus için 15 ve 75 dolar, Sonnet için 3 ve 15 dolar, hızlı ve kompakt Hakiu için ise 0,25 ve 1,25 dolar. OpenAI’nin 128K jetonlu en yeni GPT-4 turbo modeli bir milyon giriş jetonu için 10$ ve bir milyon çıkış jetonu için 30$’dır. Anthropic’in fiyatlandırma stratejisi kendinden emin görünüyor.
Anthropic’e göre Claude 3’ün “model zekasının” geliştirilmesi henüz tamamlanmadı ve şirket önümüzdeki aylarda düzenli güncellemeler yayınlamayı planlıyor. Şirket ayrıca büyük kurumsal müşterilere kodlama yardımı gibi özel hizmetler ve yetenekler sunmayı planlıyor.
Claude 3 ile ilgili duyurusunda Anthropic, kullanılan eğitim verileri hakkında yorum yapmıyor. Rakip OpenAI, eğitim verileri konusunda, OpenAI’nin gazetenin telif hakkıyla korunan verileri üzerinde kendi izni olmadan eğitim verdiğini iddia eden New York Times’ın da aralarında bulunduğu çeşitli yasal mücadelelere karışmış durumda.
Claude 3’ün teknik raporu, Anthropic’in yaygın İnternet verilerine ek olarak sentetik veriler (“dahili olarak oluşturulmuş”) kullandığını ve son tarihin Ağustos 2023 olduğunu gösteriyor.
“Claude 3 modelleri, Ağustos 2023 itibariyle internette kamuya açık bilgilerin yanı sıra üçüncü taraflardan alınan kamuya açık olmayan veriler, veri etiketleme hizmetleri ve ücretli yükleniciler tarafından sağlanan veriler ve dahili olarak ürettiğimiz verilerin özel bir karışımı üzerinde eğitilmiştir.”
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.