Sentetik sesler yaratmak ve düzenlemek için yapay zeka destekli araçlar geliştiren bir girişim olan ElevenLabs, Andreessen Horowitz, eski GitHub CEO’su Nat Friedman ve girişimci Daniel Gross gibi önde gelen yatırımcılar tarafından yönetilen 80 milyon dolarlık Seri B yatırım turunu tamamladığını duyurdu.
Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital ve Credo Ventures’ın da katıldığı bu tur ElevenLabs’ın toplam yatırım miktarını 101 milyon dolara çıkarırken şirketin değerini de 1 milyar doların üzerine çıkardı (geçtiğimiz Haziran ayında 100 milyon dolardı). CEO Mati Staniszewski, yeni kaynağın ürün geliştirme, ElevenLabs’ın altyapısını ve ekibini genişletme, yapay zeka araştırmaları ve “yapay zeka teknolojisinin sorumlu ve etik bir şekilde geliştirilmesini sağlamak için güvenlik önlemlerini artırma” için kullanılacağını söyledi.
Staniszewski, “ElevenLabs’ın ses yapay zekası araştırmaları ve ürün dağıtımında küresel lider konumunu güçlendirmek için yeni yatırım aldık” dedi.
Eski bir Google makine öğrenimi mühendisi olan Piotr Dabkowski ve eski bir Palantir dağıtım stratejisti olan Staniszewski tarafından 2022 yılında ortaklaşa kurulan ElevenLabs, yaklaşık bir yıl önce beta olarak piyasaya sürüldü. Staniszewski, Polonya’da büyüyen Dabkowski ile birlikte ses klonlama araçları yaratmak için kötü dublajlı Amerikan filmlerinden ilham aldıklarını ve yapay zekanın daha iyisini yapabileceğini düşünerek projeyi geliştirdiklerini söylediler.
ElevenLabs en çok tonlama, duygu, kadans ve diğer temel ses özellikleri için ayarlanabilir geçişlerle gerçeğe yakın sesler oluşturabilen tarayıcı tabanlı konuşma oluşturma uygulamasıyla tanınıyor. Kullanıcılar ücretsiz olarak metin girebiliyor ve bu metnin çeşitli varsayılan seslerden biri tarafından yüksek sesle okunduğu bir kayıt alabiliyor. Ödeme yapan müşteriler, ElevenLabs’ın ses klonlamasını kullanarak yeni stiller oluşturmak için ses örnekleri yükleyebilir.
ElevenLabs, sesli kitap oluşturma, film ve TV şovlarını seslendirmenin yanı sıra oyunlar ve pazarlama etkinlikleri için karakter sesleri üretmeyi amaçlayan konuşma oluşturma teknolojisinin sürümlerine giderek daha fazla yatırım yapıyor.
Geçen yıl şirket, arka plandaki gürültüyü otomatik olarak ortadan kaldırırken konuşmacının sesini, prozodisini ve tonlamasını korumaya çalışan ve film ve TV şovları söz konusu olduğunda konuşmayı kaynak materyalle çeviren ve senkronize eden bir “konuşmadan konuşmaya” aracı yayınladı. Önümüzdeki haftaların yol haritasında, transkriptler ve çeviriler oluşturmak ve düzenlemek için araçlar içeren yeni bir dublaj stüdyosu iş akışı ve ElevenLabs seslerini kullanarak web sayfalarını ve metinleri anlatan abonelik tabanlı bir mobil uygulama var.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.