Stable Diffusion XL Turbo, hızlı AI görüntüleri oluşturabilir

Stability AI, yazılı bir komuta dayalı olarak hızla görüntü üretebilen bir yapay zeka görüntü sentezleme modeli olan Stable Diffusion XL Turbo’yu piyasaya sürdü. Aslında o kadar hızlı ki, şirket bunu “gerçek zamanlı” görüntü üretimi olarak sunuyor, çünkü web kamerası gibi bir kaynaktan gelen görüntüleri de hızlı bir şekilde dönüştürebiliyor.

SDXL Turbo’nun birincil yeniliği, görüntü çıktılarını tek bir adımda üretme kabiliyetinde yatması; bu, önceki modelin gerektirdiği 20-50 adımdan önemli bir azalmaya karşılık geliyor. Stability, verimlilikteki bu sıçramayı Adversarial Diffusion Distillation (ADD) adını verdiği bir tekniğe bağlıyor. ADD, modelin mevcut görüntü sentezleme modellerinden öğrendiği skor damıtma ve modelin gerçek ve üretilen görüntüler arasında ayrım yapma yeteneğini geliştirerek çıktının gerçekçiliğini artıran karşıt kayıp yöntemlerini kullanıyor.

Stability, Salı günü yayınlanan ve ADD tekniğine odaklanan bir araştırma makalesinde modelin iç işleyişini detaylandırdı. SDXL Turbo’nun iddia edilen avantajlarından biri, özellikle tek adımlı görüntü çıktıları üretme konusunda Generative Adversarial Networks’e (GANs) benzerliği.

SDXL Turbo görüntüleri, daha yüksek adım sayılarında üretilen SDXL görüntüleri kadar ayrıntılı değildir, bu nedenle önceki modelin yerini alması düşünülmez. Ancak söz konusu hız tasarrufları için sonuçlar göz kamaştırıcı.

Denemek için SDXL Turbo’yu bir Nvidia RTX 3060 üzerinde Automatic1111 kullanarak yerel olarak çalıştırdık (ağırlıklar tıpkı SDXL ağırlıkları gibi düşüyor) ve benzer ayrıntılara sahip 20 adımlı bir SDXL görüntüsü için 26,4 saniyeye karşılık 3 adımlı 1024×1024 görüntüyü yaklaşık 4 saniyede oluşturabiliyor. Daha küçük görüntüler çok daha hızlı üretilir (512×768 için bir saniyenin altında) ve elbette RTX 3090 veya 4090 gibi daha güçlü bir grafik kartı da çok daha hızlı üretim süreleri sağlayacaktır. Stability’nin pazarlamasının aksine, SDXL Turbo görüntülerinin görüntü başına yaklaşık 3-5 adımda en iyi ayrıntıya sahip olduğunu gördük.

İLGİLİ YAZI : Tıpta yapay zekanın geleceği: Akıllı teknolojiyle sağlık hizmetlerinde devrim yaratmak

SDXL Turbo’nun üretim hızı, “gerçek zamanlı” iddiasının ortaya çıktığı yerdir. Stability AI, Nvidia A100’de (güçlü bir yapay zeka ayarlı GPU) modelin kodlama, tek bir gürültü giderme adımı ve kod çözme dahil olmak üzere 207 ms’de 512×512 görüntü oluşturabildiğini söylüyor. Tutarlılık sorunları çözülebilirse, bu gibi hızlar gerçek zamanlı üretken yapay zeka video filtrelerine veya deneysel video oyunu grafik üretimine yol açabilir. Bu bağlamda tutarlılık, birden fazla kare veya nesil arasında aynı konuyu korumak anlamına gelir.

Şu anda SDXL Turbo, ticari olmayan bir araştırma lisansı altında sunulmakta ve kullanımı kişisel, ticari olmayan amaçlarla sınırlandırılmakta. Bu hamle Stable Diffusion topluluğunda şimdiden bazı eleştirilerle karşılandı, ancak Stability AI ticari uygulamalara açık olduğunu belirtti ve ilgili tarafları daha fazla bilgi için iletişime geçmeye davet etti.

Bu arada, Stability AI’nin kendisi de iç yönetim sorunlarıyla karşı karşıya kaldı ve bir yatırımcı kısa süre önce CEO Emad Mostaque’yi istifaya çağırdı. Stability yönetiminin daha büyük bir kuruluşa potansiyel bir şirket satışını araştırdığı bildiriliyor, ancak bu Stability’nin sürüm temposunu yavaşlatmadı. Firma daha geçen hafta, hareketsiz görüntüleri kısa video kliplere dönüştürebilen Stable Video Diffusion’ı duyurdu.

Stability AI, görüntü düzenleme platformu Clipdrop’ta SDXL Turbo’nun yeteneklerinin beta gösterimini sunuyor. Ayrıca Hugging Face üzerinde resmi olmayan bir canlı demoyu ücretsiz olarak deneyebilirsiniz. Açıkçası, eğitim verilerinin kaynağının olmaması ve kötüye kullanım potansiyeli de dahil olmak üzere tüm olağan uyarılar geçerlidir. Bu çözülmemiş sorunlarla bile, yapay zeka görüntü sentezindeki teknolojik ilerleme kesinlikle yavaşlamıyor.

Kaynak: Benj Edwards / Arstechnica

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn ve Instagram‘da takip edin.

Stable Diffusion XL Turbo, yazabildiğiniz kadar hızlı AI görüntüleri oluşturabilir

Mutlaka Okumalısın

Z kuşağına yönelik yaratıcı, yapay zeka destekli mesajlaşma uygulaması: Daze

ChatGPT Windows’a geliyor

Janus, yenilikçi mimari aracılığıyla çok modlu anlayışı ve görsel üretimi bir araya getiriyor

Google, NotebookLM dakikasını bir ChatGPT anına dönüştürmek istiyor

Daha Fazla

CEVAP VER İptal

Son Haberler

Z kuşağına yönelik yaratıcı, yapay zeka destekli mesajlaşma uygulaması: Daze

ChatGPT Windows’a geliyor

Janus, yenilikçi mimari aracılığıyla çok modlu anlayışı ve görsel üretimi bir araya getiriyor

Google, NotebookLM dakikasını bir ChatGPT anına dönüştürmek istiyor

Perplexity, şirketler için ‘Dahili Bilgi Arama’yı tanıttı

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Z kuşağına yönelik yaratıcı, yapay zeka destekli mesajlaşma uygulaması: Daze

ChatGPT Windows’a geliyor