18.5 C
İstanbul

ByteDance, 2 yeni video yapay zeka modelini duyurdu

TikTok sahibi ByteDance, Çinli teknoloji firmalarının OpenAI'nin Sora'sının kaydettiği ilerlemeleri yakalamaya çalışmasıyla, metin ve resim komutlarına dayalı videolar oluşturmak için tasarlanmış, ChatGPT gibi üretken yapay zeka (YZ) uygulamalarının temelini oluşturan teknoloji olan iki yeni büyük dil modeli (LLM) başlattı.

Mutlaka Okumalısın

TikTok sahibi ByteDance, Çinli teknoloji firmalarının OpenAI’nin Sora’sının kaydettiği ilerlemeleri yakalamaya çalışmasıyla, metin ve resim komutlarına dayalı videolar oluşturmak için tasarlanmış, ChatGPT gibi üretken yapay zeka (YZ) uygulamalarının temelini oluşturan teknoloji olan iki yeni büyük dil modeli (LLM) başlattı.

ByteDance’in geçen yıl tanıttığı Doubao sohbet robotuyla aynı adı paylaşan Doubao AI model ailesinin bir parçası olan yeni Doubao-PixelDance ve Doubao-Seaweed LLM’leri, ByteDance bulut birimi Volcano Engine başkanı Tan Dai’ye göre bu ekim ayının başlarında kullanıma sunulacak.

Volcano Engine’in internet sitesinde yer alan bilgiye göre, karmaşık ve ardışık hareketleri işleyebilen Doubao-PixelDance modeli 10 saniyelik videolar üretebilirken, Doubao-Seaweed modeli ise 30 saniyeye kadar uzunlukta klipler üretebiliyor.

Tan, Salı günü Shenzhen’de düzenlenen bir etkinlikte, Doubao LLM ailesine video üretim yapay zeka modellerinin eklenmesinin “Douyin ve Jianying’in yıllar içinde biriktirdiği videoları anlama yeteneklerinden faydalandığını” söyledi ve anakara dışında TikTok’un Çince versiyonu ve ByteDance’in CapCut olarak bilinen popüler video düzenleme uygulamasına atıfta bulundu.

Tan’ın etkinlikteki gösterisi, her iki yeni yapay zeka modelinin de, bir arabayı birinci şahıs bakış açısıyla sürme gibi gerçek yaşam sahnelerini simüle eden videolar ve uçan kanatlı bir kurbağa ve yüzen bir ada gibi kurgusal klipler üretebildiğini gösterdi.

Yeni modellerin, bir videonun bir çekimden diğerine geçerken konu ve stil açısından “istikrar” sağladığını ve bunun diğer video üretimi LLM’leri için büyük bir zorluk olmaya devam ettiğini söyledi.

ByteDance’in son LLM’leri, Çinli teknoloji firmalarının bu yeni YZ pazar segmentine agresif hamleler yapmasının birkaç ay önce OpenAI’nin Şubat ayında Sora tarafından oluşturulan videoların örneklerini ilk kez ortaya koymasından ve ülkenin ABD’deki ilerlemelere ayak uydurma becerisi konusunda endişelere yol açmasından sonra nasıl olduğunu yansıtıyor . Sora henüz kamuoyuna açıklanmadı.

Tan, Salı günü ayrıca Doubao AI model ailesinin iki yeni üyesini, bir müzik jeneratörünü ve bir simultane tercümanı piyasaya sürdü.

İLGİLİ YAZI :   MIT araştırmacıları veritabanları için üretken yapay zekayı tanıttı

Mevcut Doubao Pro LLM programının 256.000 tokene veya 400.000 Çince karaktere kadar olan çok uzun metin istemlerini işleyebilecek şekilde yükseltileceğini, fiyatının ise aynı kalacağını söyledi.

Tan’a göre, Mayıs ayında ticari olarak piyasaya sürülmesinden bu yana Doubao LLM ailesi kullanımda 10 kat artış gördü. Modellerin her gün işlediği ortalama token sayısının bu ay 1,3 trilyonu aştığını, Mayıs ayında ise 120 milyardan fazla olduğunu söyledi.

Araştırma şirketi LeadLeo’ya göre, anakaradaki yapay zeka video üretim araçları pazarının 2021’deki 8 milyon yuanlık seviyesinden 2026’da 9,3 milyar yuana (1,3 milyar ABD doları) ulaşması bekleniyor.

Çinli teknoloji şirketleri, OpenAI’nin 9 Temmuz’dan itibaren Çin anakarası, Hong Kong ve Makao’da ürünlerine erişimi engellemeye başlamasının ardından üretken yapay zeka hizmetlerinden para kazanmak için daha fazla fırsat görüyor.

Geçtiğimiz yaz, ByteDance Sora tarzı metinden videoya AI uygulaması Jimeng’i piyasaya sürdü. 31 Temmuz’da çeşitli yerel Android uygulama mağazalarında yayınlanmasının ardından Apple’ın anakara App Store’unda indirilebilir hale geldi. Masaüstü sürümü Mayıs ayında piyasaya sürüldü.

Video üretim ürünlerine sahip diğer yerli teknoloji firmaları arasında , bu ayın başlarında video-01 modelini piyasaya süren MiniMax; Temmuz ayında metinden videoya dönüştürme aracı Vidu’yu piyasaya süren Shengshu AI; aynı ayda kendi Ying modelini tanıtan Zhipu AI; ve Haziran ayında Kling metinden videoya dönüştürme hizmetini piyasaya süren kısa video uygulaması operatörü Kuaishou Technology yer alıyor.

Alibaba Group Holding geçen ay OpenSora temel modeline dayanan Tora adlı bir video oluşturma aracı üzerinde çalıştığını söyledi.

Kaynak: SCMP


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler