Açık kaynaklı PixArt-δ'dan iddialı yapay zeka görüntü oluşturucu

Bu yazıda neler var?

Stable Diffusion, açık kaynaklı görüntü oluşturucular söz konusu olduğunda yakında bazı rakiplere sahip olabilir. PixArt, en son yinelemesinde nispeten yüksek çözünürlüğü korurken daha hızlı ve daha doğru hale geliyor.

The Decoder.com’un haberine göre, Huawei Nuh’un Gemisi Laboratuvarı, Dalian Teknoloji Üniversitesi, Tsinghua Üniversitesi ve Hugging Face’ten araştırmacılar, Stable Diffusion ailesiyle rekabet etmek için tasarlanmış gelişmiş bir metinden görüntüye sentez çerçevesi olan PixArt-δ’yı (Delta) bir makalede sundu.

Bu model, 1024 x 1024 piksel çözünürlüğe sahip görüntüleri hızlı bir şekilde üretebilen önceki PixArt-α (Alpha) modeline göre önemli bir gelişmedir.

Yarım saniyede yüksek çözünürlüklü görüntü oluşturma

PixArt-δ, Gizli Tutarlılık Modeli (LCM) ve ControlNet’i PixArt-α modeline entegre ederek çıkarım hızını önemli ölçüde artırır. Model, sadece iki ila dört adımda 1.024 x 1.024 piksel çözünürlüğe sahip yüksek kaliteli görüntüleri PixArt-α’dan yedi kat daha hızlı bir şekilde 0,5 saniye gibi kısa bir sürede üretebilir.

Stability AI tarafından Kasım 2023’te tanıtılan SDXL Turbo, 512 x 512 piksellik görüntüleri yalnızca bir adımda veya yaklaşık 0,2 saniyede oluşturabilir.

Ancak PixArt-δ’nın sonuçları SDXL Turbo ve LCM’li dört adımlı SDXL varyantına kıyasla daha yüksek çözünürlüklü ve daha tutarlı görünüyor. Görüntülerde daha az hata var gibi görünüyor ve model talimatları daha doğru bir şekilde takip ediyor.

Yeni PixArt modeli, 32 GB VRAM’e sahip V100 GPU’larda bir günden daha kısa bir sürede verimli bir şekilde eğitilmek üzere tasarlanmıştır. Buna ek olarak, 8 bitlik çıkarım yeteneği, 8 GB GPU’larda bile 1024 piksellik görüntüleri sentezlemesine olanak tanıyarak kullanılabilirliğini ve erişilebilirliğini büyük ölçüde artırıyor.

Görüntü oluşturma üzerinde daha fazla kontrol

Bir ControlNet modülünün PixArt-δ’ya entegrasyonu, referans görüntüleri kullanarak metinden görüntüye difüzyon modellerinin daha hassas kontrolüne olanak tanıryo. Araştırmacılar, yüksek kaliteli görüntü üretimini korurken açık kontrol edilebilirlik sağlayan transformatör tabanlı modeller için özel olarak tasarlanmış yeni bir ControlNet mimarisini tanıttılar.

İLGİLİ YAZI : Yapay zeka girişimi için iyi bir fikriniz mi var? OpenAI size 1 milyon dolar destek vermeye hazır

Araştırmacılar Hugging Face’te PixArt-δ’nın ControlNet varyantı için ağırlıkları yayınladılar. Ancak, çevrimiçi bir demo yalnızca LCM’li ve LCM’siz PixArt-α için mevcut görünüyor.

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.

Açık kaynaklı PixArt-δ görüntü oluşturucu 0,5 saniyede yüksek çözünürlüklü yapay zeka görüntüleri üretiyor

Mutlaka Okumalısın

Z kuşağına yönelik yaratıcı, yapay zeka destekli mesajlaşma uygulaması: Daze

ChatGPT Windows’a geliyor

Janus, yenilikçi mimari aracılığıyla çok modlu anlayışı ve görsel üretimi bir araya getiriyor

Google, NotebookLM dakikasını bir ChatGPT anına dönüştürmek istiyor

Yarım saniyede yüksek çözünürlüklü görüntü oluşturma

Görüntü oluşturma üzerinde daha fazla kontrol

Daha Fazla

CEVAP VER İptal

Son Haberler

Z kuşağına yönelik yaratıcı, yapay zeka destekli mesajlaşma uygulaması: Daze

ChatGPT Windows’a geliyor

Janus, yenilikçi mimari aracılığıyla çok modlu anlayışı ve görsel üretimi bir araya getiriyor

Google, NotebookLM dakikasını bir ChatGPT anına dönüştürmek istiyor

Perplexity, şirketler için ‘Dahili Bilgi Arama’yı tanıttı

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Z kuşağına yönelik yaratıcı, yapay zeka destekli mesajlaşma uygulaması: Daze

ChatGPT Windows’a geliyor