Meta AI, ifadeyi koruyan ve akışı geliştiren bir AI dil çeviri modelleri paketini tanıttı.
- SeamlessExpressive, konuşma çevirisinde tonların, duygusal ifadelerin ve ses tarzlarının aktarılmasını sağlar. Burada kendi sesinizi girdi olarak kullanarak SeamlessExpressive’in demosunu deneyebilirsiniz.
- SeamlessStreaming, konuşmadan konuşmaya ve konuşmadan metne çevirilerin akışını 2 saniyeden az gecikmeyle ve çevrimdışı bir modelle neredeyse aynı doğrulukla sağlayan yeni bir model. Konuşmacı cümlesini bitirdiğinde çeviri yapan geleneksel sistemlerin aksine, SeamlessStreaming, konuşmacı konuşurken çeviri yapar. Bir sonraki çevrilmiş bölümün çıktısını almak için yeterli bağlama sahip olup olmadığına akıllıca karar verir.
- SeamlessM4T v2, hem konuşma hem de metin için temel, çok dilli ve çoklu görev modeli. SeamlessM4T’nin halefi olup ASR, konuşmadan konuşmaya, konuşmayı metne ve metinden konuşmaya görevlerinde performans iyileştirmeleri gösterir.
- Seamless, SeamlessExpressive, SeamlessStreaming ve SeamlessM4T v2’nin özelliklerini tek bir modelde birleştiren bir model.
Stability AI, gerçek zamanlı bir Metinden Görüntüye oluşturma modeli olan SDXL Turbo’yu piyasaya sürdü. SDXL Turbo, modelin görüntü çıktılarını tek adımda sentezlemesine ve yüksek örnekleme doğruluğunu korurken gerçek zamanlı metinden görüntüye çıktılar üretmesine olanak tanıyan yeni bir damıtma teknolojisine dayanıyor.
Mozilla’nın inovasyon grubu ve Justine Tunney, LLM’leri tek bir dosyayla dağıtmanıza ve çalıştırmanıza olanak tanıyanllamafile’ı yayınladı. llamafiles altı işletim sisteminde (macOS, Windows, Linux, FreeBSD, OpenBSD ve NetBSD) ve birden fazla CPU mimarisinde çalışabilir.
Perplexity iki yeni PPLX modelini piyasaya sürdü: pplx-7b-online ve pplx-70b-online. Bu çevrimiçi LLM’ler, yanıt oluştururken interneti kullanarak en güncel bilgilerden yararlanabilirler.
Google DeepMind, MindGNoME’yi (Malzeme Araştırması için Grafik Ağları) sundu: Presented 2,2 milyon yeni kristal yapı keşfeden bir yapay zeka aracı, 380.000’i son derece kararlı ve süper iletkenler, süper bilgisayarlar ve elektrikli araçlar için gelişmiş pillerde çığır açıcı gelişmeler için umut verici.
Amazon, iki yeni Amazon Titan multimodal temel modelini (FM) tanıttı: Amazon Titan Image Generator (önizleme) ve Amazon Titan Multimodal Embeddings. Amazon Titan tarafından üretilen tüm görüntüler görünmez bir filigran içeriyor.
Araştırmacılar, çoklu görünümlü RGB videolardan gerçekçi insan avatarları oluşturabilen yeni bir avatar temsil yöntemi olan Animatable Gaussians‘ı sundu.
Pika Labs, metin, görüntü veya mevcut videoyu kullanarak 3D animasyon, anime, çizgi film ve sinematik gibi çeşitli tarzlarda videolar oluşturabilen ve düzenleyebilen yeni bir AI modeli içeren, üretken AI video aracı Pika 1.0‘ın önemli bir ürün yükseltmesini yayınladı.
Eleven Labs, solo girişimcilere ve startup’lara ilk 3 ay boyunca ayda 11 milyon metin karakteri içerik sunan bir hibe programı duyurdu.
UC Berkeley‘den araştırmacılar, Yapay Zeka Geri Bildiriminden Takviyeli Öğrenme (RLAIF) kullanılarak eğitilen açık ve büyük bir dil modeli olan Starling-7B‘yi tanıttı. GPT-4 etiketli sıralama veri setini, Nectar’ı ve yeni bir ödül eğitim hattını kullanıyor. Starling-7B, OpenAI’nin GPT-4 ve GPT-4 Turbo hariç MT-Bench’te bugüne kadarki tüm modellerden daha iyi performans gösteriyor.
XTX Markets, Yapay Zeka Matematik Olimpiyatı Ödülü (AI-MO Ödülü) adında 10 milyon dolarlık yeni bir meydan okuma fonu başlatıyor. 5 milyon dolarlık büyük ödül, AI-MO onaylı bir yarışmaya katılan ve Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalyaya eşdeğer bir standartta performans gösteren ilk halka açık yapay zeka modeline verilecek.
Microsoft Research, hastalık sınıflandırması ve bulguların özetlenmesi gibi görevlere odaklanarak radyoloji raporlarını işlemek için GPT-4’ü değerlendirdi. Çalışma, GPT-4’ün yeterli düzeyde radyoloji bilgisine sahip olduğunu ve yalnızca nüanslı alan bilgisi gerektiren karmaşık bağlamlarda nadiren hata yaptığını ortaya koydu. GPT-4 tarafından üretilen radyoloji rapor özetlerinin karşılaştırılabilir olduğu ve hatta bazı durumlarda deneyimli radyologlar tarafından yazılanlara tercih edildiği görüldü.
AWS, işletmeler için yapay zeka destekli yeni bir asistan olan Amazon Q‘yu duyurdu. Çalışanların, şirketlerinin entegre içerik sistemleri içinde çeşitli içerik havuzlarından sorgulama yapmalarını ve yanıtlar almalarını, raporları özetlemelerini, makaleler yazmalarını, görevleri yerine getirmelerini ve daha fazlasını yapmalarını sağlar. Amazon Q, popüler kurumsal sistemlere 40’tan fazla yerleşik bağlayıcı sunuyor
Aralarında ABD ve İngiltere’nin de bulunduğu 18 ülke, yapay zekanın haydut aktörlere karşı nasıl güvende tutulacağına ilişkin ayrıntılı bir uluslararası anlaşma imzalayarak, şirketlerin ‘tasarım gereği güvenli’ yapay zeka sistemleri oluşturmalarını teşvik etti.
Yapay Zeka Devrimi – Coatue tarafından hazırlanan veri destekli bir rapor.
Röportaj: Sam Altman OpenAI tarafından kovulma ve yeniden işe alınma üzerine soruları yanıtladı.
Peter levels tarafından ChatGPT MonkeyIslandAmsterdam.com’da GPT’leri kullanan görüntü+metin tabanlı macera oyununun açık kaynak sürümü sunuldu.