San Francisco merkezli bir girişim olan Writer, Palmyra modeli için Palmyra-Vision adını verdikleri, grafikler ve çizelgeler de dahil olmak üzere görüntülerden metin üreten yeni bir özelliği duyurdu.
Şirketin kurucu ortağı ve CEO’su May Habib, çok modlu içeriğe odaklanmak için stratejik bir karar aldıklarını ve görüntülerden metin üretebilmenin bu stratejinin bir parçası olduğunu söyledi. Habib, “Çok modlu girdiye odaklanacağız, ancak metin çıktısı, yani metin üretimi ve metin yoluyla sunulan içgörü” dedi.
Habib’e göre şirket, Palmyra-Vision sonuçlarını üretmek için her modelin görüntüde ne olduğunu belirlemek ve ardından dört dokuz doğrulukla metni oluşturmak için belirli bir görevi olduğu çoklu bir model yaklaşımı kullanıyor.
Bunun, bir e-ticaret web sitesinin binlerce değişen görüntüden metin üreterek web sitesini her değişikliğe ayak uydurmak zorunda kalmadan en son ürünlerle doldurması veya çizelge ve grafiklerden elde edilen önemli çıkarımları otomatik olarak yorumlaması gibi bir dizi kullanım durumu var. Bir başka örnek de uygunluk kontrolü. Örneğin, bir ilaç şirketi Palmyra-Vision’ı reklam metnine karşı otomatik bir FDA uyumluluk kontrolü gerçekleştirmek için kullanabilir ve aşağıdaki örnekte olduğu gibi reklamın ilişkili bir belgede belirtildiği gibi FDA düzenlemeleriyle uyumlu olduğundan emin olabilir.
Son olarak ürün, el yazısıyla yazılmış notları yorumlayıp özetleyerek metne dönüştürebiliyor, ancak Habib, doğruluğun sağlanabilmesi için modelin tıbbi veya sigorta gibi bireysel kullanım durumları için eğitilmesi gerektiğini söylüyor.
Habib, iş akışının bir parçası olarak insan incelemesi olmadan bu araçların kullanılmasını önermediğini söylüyor. Bunun kesinlikle gerekli olduğuna inanıyor çünkü herhangi bir model halüsinasyon görebilir (bir şeyler uydurabilir) veya basitçe gerçekleri yanlış anlayabilir ve sonuçları kontrol eden insanların olması önemlidir. Bunu her müşteriye her zaman tavsiye etseler ve çoğu bu noktada anlasa da, bunun müşteriler arasında tutarlı bir şekilde gerçekleşmesini sağlamak için sonunda daha otomatik bir iş akışı gerektireceğine inanıyor ve bunun için çalıştıklarını söylüyor.
Crunchbase verilerine göre şirket bugüne kadar 126 milyon dolar topladı ve şu anda şirketi ölçeklendirmeye çalışırken büyük bulut altyapı platformlarıyla ortaklık hakkında konuşuyor. Şirketin en son turu geçtiğimiz Eylül ayında Iconiq liderliğinde 100 milyon dolarlık B Serisi oldu.
Resimden metne dönüştürme özelliğine sahip en son Palmyra sürümü şu an kullanılabilir.
Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.