15 C
İstanbul

Stable Diffusion XL Turbo, yazabildiğiniz kadar hızlı AI görüntüleri oluşturabilir

Stability AI, yazılı bir komuta dayalı olarak hızla görüntü üretebilen bir yapay zeka görüntü sentezleme modeli olan Stable Diffusion XL Turbo'yu piyasaya sürdü.

Mutlaka Okumalısın

Stability AI, yazılı bir komuta dayalı olarak hızla görüntü üretebilen bir yapay zeka görüntü sentezleme modeli olan Stable Diffusion XL Turbo’yu piyasaya sürdü. Aslında o kadar hızlı ki, şirket bunu “gerçek zamanlı” görüntü üretimi olarak sunuyor, çünkü web kamerası gibi bir kaynaktan gelen görüntüleri de hızlı bir şekilde dönüştürebiliyor.

SDXL Turbo’nun birincil yeniliği, görüntü çıktılarını tek bir adımda üretme kabiliyetinde yatması; bu, önceki modelin gerektirdiği 20-50 adımdan önemli bir azalmaya karşılık geliyor. Stability, verimlilikteki bu sıçramayı Adversarial Diffusion Distillation (ADD) adını verdiği bir tekniğe bağlıyor. ADD, modelin mevcut görüntü sentezleme modellerinden öğrendiği skor damıtma ve modelin gerçek ve üretilen görüntüler arasında ayrım yapma yeteneğini geliştirerek çıktının gerçekçiliğini artıran karşıt kayıp yöntemlerini kullanıyor.

Stability, Salı günü yayınlanan ve ADD tekniğine odaklanan bir araştırma makalesinde modelin iç işleyişini detaylandırdı. SDXL Turbo’nun iddia edilen avantajlarından biri, özellikle tek adımlı görüntü çıktıları üretme konusunda Generative Adversarial Networks’e (GANs) benzerliği.

SDXL Turbo görüntüleri, daha yüksek adım sayılarında üretilen SDXL görüntüleri kadar ayrıntılı değildir, bu nedenle önceki modelin yerini alması düşünülmez. Ancak söz konusu hız tasarrufları için sonuçlar göz kamaştırıcı.

Denemek için SDXL Turbo’yu bir Nvidia RTX 3060 üzerinde Automatic1111 kullanarak yerel olarak çalıştırdık (ağırlıklar tıpkı SDXL ağırlıkları gibi düşüyor) ve benzer ayrıntılara sahip 20 adımlı bir SDXL görüntüsü için 26,4 saniyeye karşılık 3 adımlı 1024×1024 görüntüyü yaklaşık 4 saniyede oluşturabiliyor. Daha küçük görüntüler çok daha hızlı üretilir (512×768 için bir saniyenin altında) ve elbette RTX 3090 veya 4090 gibi daha güçlü bir grafik kartı da çok daha hızlı üretim süreleri sağlayacaktır. Stability’nin pazarlamasının aksine, SDXL Turbo görüntülerinin görüntü başına yaklaşık 3-5 adımda en iyi ayrıntıya sahip olduğunu gördük.

İLGİLİ YAZI :   Capsule'ün yeni uygulaması haberleri düzenlemek için yapay zeka ve insan editörleri bir araya getiriyor

SDXL Turbo’nun üretim hızı, “gerçek zamanlı” iddiasının ortaya çıktığı yerdir. Stability AI, Nvidia A100’de (güçlü bir yapay zeka ayarlı GPU) modelin kodlama, tek bir gürültü giderme adımı ve kod çözme dahil olmak üzere 207 ms’de 512×512 görüntü oluşturabildiğini söylüyor. Tutarlılık sorunları çözülebilirse, bu gibi hızlar gerçek zamanlı üretken yapay zeka video filtrelerine veya deneysel video oyunu grafik üretimine yol açabilir. Bu bağlamda tutarlılık, birden fazla kare veya nesil arasında aynı konuyu korumak anlamına gelir.

Şu anda SDXL Turbo, ticari olmayan bir araştırma lisansı altında sunulmakta ve kullanımı kişisel, ticari olmayan amaçlarla sınırlandırılmakta. Bu hamle Stable Diffusion topluluğunda şimdiden bazı eleştirilerle karşılandı, ancak Stability AI ticari uygulamalara açık olduğunu belirtti ve ilgili tarafları daha fazla bilgi için iletişime geçmeye davet etti.

Bu arada, Stability AI’nin kendisi de iç yönetim sorunlarıyla karşı karşıya kaldı ve bir yatırımcı kısa süre önce CEO Emad Mostaque’yi istifaya çağırdı. Stability yönetiminin daha büyük bir kuruluşa potansiyel bir şirket satışını araştırdığı bildiriliyor, ancak bu Stability’nin sürüm temposunu yavaşlatmadı. Firma daha geçen hafta, hareketsiz görüntüleri kısa video kliplere dönüştürebilen Stable Video Diffusion’ı duyurdu.

Stability AI, görüntü düzenleme platformu Clipdrop’ta SDXL Turbo’nun yeteneklerinin beta gösterimini sunuyor. Ayrıca Hugging Face üzerinde resmi olmayan bir canlı demoyu ücretsiz olarak deneyebilirsiniz. Açıkçası, eğitim verilerinin kaynağının olmaması ve kötüye kullanım potansiyeli de dahil olmak üzere tüm olağan uyarılar geçerlidir. Bu çözülmemiş sorunlarla bile, yapay zeka görüntü sentezindeki teknolojik ilerleme kesinlikle yavaşlamıyor.

Kaynak: Benj Edwards / Arstechnica


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn ve Instagram‘da takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler