Google, metin açıklamalarından görseller üretmek için yeni bir yapay zeka (YZ) modeli olan Imagen 3’ü yayınladı. Google’a göre, kalite ve ayrıntılara gösterilen özen açısından önceki tüm modelleri geride bırakıyor.
Google, Imagen 3’ü Mayıs ayında tanıttı ve Haziran ayında ilk test kullanıcılarına sundu. Model artık en azından bazı ülkelerde ImageFX aracılığıyla ücretsiz olarak kullanılabilir.
Yayınlanan bildiride, Imagen 3’ün kalite ve ayrıntı açısından metinden resme dönüştürme modelleri için yeni bir standart belirlediği belirtiliyor.
Imagen 3, Google’ın değerlendirmelerinde rakiplerini geride bırakıyor
Imagen 3, büyük bir görüntü, metin ve açıklama veri kümesi üzerinde eğitildi. Veriler, güvenli olmayan, şiddet içeren veya düşük kaliteli içerikleri ve YZ tarafından oluşturulan görüntüleri kaldırmak için çok adımlı bir filtreleme sürecinden geçti. Yinelenenler de kaldırıldı ve benzer görüntülerin derecesi düşürüldü.
Google’ın insan ve otomatik değerlendirmelerinde Imagen 3, Imagen 2, DALL-E 3, Midjourney v6, Stable Diffusion 3 ve Stable Diffusion XL 1.0’dan daha iyi performans gösterdi. Imagen 3, metin açıklamalarını oluşturulan görsellerle eşleştirme ve ayrıntılı istemleri işleme konusunda özellikle güçlüydü. Yakın zamanda yayınlanan FLUX modeliyle karşılaştırmalar eksik.
Ancak artık X üzerinde karşılaştırmalar mevcut; kullanıcı Dogan Ural, Midjourney, Imagen ve FLUX’un örneklerini yan yana paylaştı.
Google just released Imagen 3!
Their latest text-to-image generator.
Here’s a couple of side-by-side with Midjourney & Flux pic.twitter.com/7b8XrjP2BI
— Dogan Ural (@doganuraldesign) August 9, 2024
Google’a göre, sayısal muhakeme gerektiren görevler, örneğin tam sayıda nesne üretmek gibi, hala zayıflıklar var. Mekansal muhakeme ve karmaşık dil içeren istemler de zorlayıcı olmaya devam ediyor.
Imagen 3, ABD’de ImageFX aracılığıyla satışa sunuldu.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.