31.4 C
İstanbul

Çin’den OpenAI’ın Sora’sına büyük rakip: KLING

Çinli bir teknoloji şirketi olan Kuaishou, 1080p çözünürlükte ve saniyede 30 kare hızında iki dakikaya kadar videolar üretebilen, video üretimi için bir yapay zeka modeli olan KLING'i tanıttı.

Mutlaka Okumalısın

Çinli teknoloji şirketi Kuaishou, yeni bir video nesil modeli olan KLING’i tanıttı. Demolara bakılırsa OpenAI’nin Sora’sına rakip olabilir.

Kuaishou, KLING’in 1080p çözünürlükte ve saniyede 30 kare hızında iki dakikaya kadar videolar oluşturabildiğini söylüyor. Ayrıca fiziksel olarak doğru olan karmaşık hareket dizilerini de modelleyebiliyor.

Bir videoda “Pencereden görülen farklı manzaralarla tren yolculuğu” komutuyla yapılan iki dakikalık bir tren yolculuğu gösteriliyor. OpenAI, bir dakika uzunluğa kadar nispeten tutarlı videolar içeren video modeli Sora’yı Şubat ayı ortasında duyurdu.

Daha uzun bir videonun bir başka örneği, mevsimler değişirken bir bahçede bisiklete binen bir çocuğu gösteriyor. Elbette manzaralar mevsimlere göre değişiyor ve belki de uzunluğu yakalamanın püf noktası budur, ancak bisikletli çocuk oldukça tutarlı görünüyor. Yine de aynı bahçenin etrafında daireler çizseydi daha etkileyici olurdu.

Bir fast food restoranında çizburger yiyen bir çocuğun videosu da dikkat çekicidir. Çocuk ilk ısırığı aldıktan sonra burger küçülüyor.

Bir bıçağın soğanı kesmesi ve bir adamın tabaktan makarna yemesi, videoda bir değişikliğe neden olan iki nesne arasındaki fiziksel etkileşimin benzer örnekleridir. Ancak bu örnekler yalnızca birkaç saniye sürüyor, dolayısıyla bu “fiziksel simülasyonun” ne kadar tutarlı olduğu net değil.

Geliştiriciler KLING’in hareket ve fiziksel etkileşimi daha iyi modellemek için 3D uzay-zaman dikkat sistemi kullandığını ve modelin ölçeklenebilir bir çerçeve ve optimize edilmiş çıkarım sayesinde uzun, yüksek çözünürlüklü videolar üretebildiğini söylüyor.

Kuaishou, modelin gerçek dünyanın fiziksel özelliklerini doğru bir şekilde simüle ettiğini iddia ediyor. Model ayrıca bir difüzyon transformatörü kullanarak kavramları birleştirebiliyor ve yoğun bir şehirde araba süren bir kedi gibi kurgusal sahneler yaratabiliyor.

OpenAI’nin Sora’sı da bir difüzyon transformatörü kullanıyor ve video jeneratörünü bir “dünya simülatörü” olarak tanımlıyor; ancak Meta’dan Yann LeCun gibi yapay zeka uzmanları bu kadar cesur bir iddiada bulunduğu için startup’ı eleştirdi.

İLGİLİ YAZI :   OpenAI daha iyi çalışan GPT-4 modelini piyasaya sürdü ve GPT-3.5 için fiyatları düşürdü

KLING şu anda Çin’de halka açık bir demo olarak mevcut. Kuaishou, Çin’de en çok sosyal medya uygulamalarıyla tanınan Pekin merkezli bir teknoloji şirketi. KLING ile şimdi büyük ölçekli üretken yapay zeka modelleri yarışına giriyor.

Teknoloji yatırımcısı ve aktör Ashton Kutcher’ın Sora’nın beta sürümüne erişimi var. Video için üretken yapay zekanın film pazarını ve Hollywood’u dönüştüreceğine inanıyor.


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler