29.7 C
İstanbul

IBM: Üretken yapay zeka işleri otomatikleştirebilir

SNAP adı verilen yeni bir program, kredi başvurusu veya İK durumu gibi bir süreçte bir sonraki en olası gelişmeyi tahmin etmek için büyük dil modelleri kullanıyor.

Mutlaka Okumalısın

Bugünlerde kurumsal çalışmaların büyük bir odak noktası, daha fazla verimlilik için insan görevlerini otomatikleştirmek. Bilgisayar devi IBM, en son araştırmasında büyük dil modelleri (LLM’ler) gibi üretken yapay zekanın (AI) otomasyon için bir basamak olup olamayacağını soruyor.

“SNAP” adı verilen IBM’in önerdiği yazılım çerçevesi, bir LLM’yi eğiterek daha önce gerçekleşen tüm olaylar göz önüne alındığında bir iş sürecinde gerçekleşecek bir sonraki eylemin tahminini oluşturuyor. Bu tahminler de bir işletmenin atabileceği adımlar için öneriler olarak hizmet edebilir.

IBM Research’ten Alon Oved ve meslektaşları SNAP adlı yeni bir makalede “SNAP, çeşitli BPM [iş süreci yönetimi] veri kümeleri için bir sonraki etkinlik tahmin performansını artırabilir” diye yazıyor: Semantic Stories for Next Activity Prediction, bu hafta arXiv sunucusunda yayınlandı.

IBM’in çalışması, bir serideki bir sonraki olayı veya eylemi tahmin etmeye çalışmak için LLM’leri kullanmaya yönelik eğilimin sadece bir örneği. Akademisyenler, zaman serisi verileri (trendleri tespit etmek için zaman içinde farklı noktalarda aynı değişkenleri ölçen veriler) olarak adlandırılan verilerle çalışıyorlar. IBM çalışması zaman serisi verilerini kullanmıyor, ancak sıralı olaylar ve olası sonuçlar kavramına odaklanıyor.

SNAP, “bir sonraki faaliyet tahmini için semantik hikayeler “in kısaltmasıdır. Sonraki faaliyet tahmini (SNAP’ın NAP kısmı), sistem araştırmalarının onlarca yıllık mevcut bir alanı. NAP tipik olarak, o noktaya kadar olan tüm adımlar girildikten sonra, genellikle “süreç madenciliği” olarak bilinen bir uygulama olan iş günlüğünden bir sonraki adımda ne olacağını tahmin etmek için eski yapay zeka biçimlerini kullanıyor.

SNAP’ın semantik hikayeler unsuru IBM’in çerçeveye eklediği kısımdır. Buradaki fikir, geleneksel yapay zeka programlarının faaliyetlerinin ötesine geçmek için GPT-3 gibi programlardaki dil zenginliğini kullanmak. Dil modelleri bir iş sürecinin daha fazla detayını yakalayabilir ve bunları doğal dilde tutarlı bir “hikayeye” dönüştürebilir.

İLGİLİ YAZI :   Nvidia CEO'su Jensen Huang yeni yapay zeka çiplerini duyurdu

Oved ve ekibi, eski YZ programlarının iş süreçleriyle ilgili tüm verileri işleyemediğini belirtiyor: “Bir sınıflandırma modeli oluşturmak için girdi olarak yalnızca faaliyetlerin sırasını kullanıyorlar ve tahminler için böyle bir çerçevede ek sayısal ve kategorik nitelikler nadiren dikkate alınıyor.”

Buna karşın bir LLM, çok daha fazla ayrıntıyı seçebilir ve bunları bir hikaye haline getirebilir. Örnek olarak bir kredi başvurusu verilebilir. Başvuru süreci birkaç adım içerir. LLM, veritabanından kredi tutarı hakkında “tutar = 20.000 $” ve “talep başlangıç tarihi = 20 Ağustos 2023” gibi çeşitli öğelerle beslenebilir.

Bu veri öğeleri LLM tarafından otomatik olarak doğal bir dil anlatımına dönüştürülebilir, örneğin:

“Talep edilen kredi tutarı 20.000$ idi ve müşteri tarafından talep edildi. “Başvuruyu Kaydet” faaliyeti, vaka başladıktan 12 gün sonra gerçekleşen 6. turda gerçekleşti […]”

SNAP sistemi üç adımdan oluşuyor. İlk olarak, bir hikaye için bir şablon oluşturuluyor. Daha sonra, bu şablon tam bir anlatı oluşturmak için kullanılıyor. Son olarak da hikayeler, hikayede gerçekleşecek bir sonraki olayı tahmin etmek üzere LLM’yi eğitmek için kullanılıyor.

IBM’in SNAP’ı, bir iş sürecinin özelliklerinin bir listesini alıp bunları üretici yapay zeka aracılığıyla bir anlatıya dönüştürebilir ve bu anlatı daha sonra bir sonraki en olası gelişmeyi tahmin etmek için kullanılabilir.

İlk adımda, kredi tutarı gibi öznitelikler, bir hikaye için bir iskele olan bir şablona nasıl dönüştürülebileceklerine dair bir örnekle birlikte dil modeli istemine besleniyor. Dil modeline aynı şeyi yeni bir nitelik kümesi için yapması söyleniyor ve yeni bir şablon çıkarılıyor.

İkinci adımda, bu yeni şablon dil modeline beslenir ve model tarafından doğal dilde bitmiş bir hikaye olarak dolduruluyor.

Son adım, bu tür birçok hikayeyi bir LLM’ye besleyerek bir sonraki adımda ne olacağını tahmin etmesi için eğitmek. Hikayelerin bu kombinasyonunun sonucu “temel gerçek” eğitim örnekleri.

Oved ve ekibi araştırmalarında, SNAP’ın bir sonraki eylem tahmininde eski yapay zeka programlarından daha iyi olup olmadığını test ediyor. Otomobil üreticisi Volvo’nun BT olaylarına ilişkin gerçek veri tabanı, çevresel izin süreci kayıtlarından oluşan bir veri tabanı ve hayali insan kaynakları vakalarından oluşan bir koleksiyon da dahil olmak üzere kamuya açık dört veri seti kullanıyorlar.

İLGİLİ YAZI :   Google CEO'su Sundar Pichai: İşten çıkarmalar bu yıl da devam edecek

Yazarlar üç farklı “dil temel modeli” kullanmaktadır: OpenAI’nin GPT-3’ü, Google’ın BERT’i ve Microsoft’un DeBERTa’sı. Her üçünün de “yerleşik ölçütlere kıyasla üstün sonuçlar verdiğini” söylüyorlar.

İlginç bir şekilde, GPT-3 diğer iki modelden daha güçlü olmasına rağmen, testlerdeki performansı nispeten mütevazıdır. Yazarlar, “BERT gibi nispeten küçük açık kaynaklı LFM’lerin bile büyük modellere kıyasla sağlam SNAP sonuçlarına sahip olduğu” sonucuna varıyor.

Yazarlar ayrıca dil modellerinin tam cümlelerinin performans için önemli göründüğünü tespit ediyor.

“Anlamsal hikâye yapısı önemli mi?” diye sorup sonuca varıyorlar: “İş süreci günlüklerinden tutarlı ve dilbilgisi açısından doğru anlamsal öykülerin tasarlanması SNAP algoritmasında önemli bir adım teşkil ediyor.”

GPT-3 ve diğer modellerden elde edilen hikayeleri, aynı bilgileri tek bir uzun metin dizesinde birleştirdikleri farklı bir yaklaşımla karşılaştırıyorlar. Tam, dilbilgisel cümleler kullanan ilk yaklaşımın, yalnızca bir dizi öznitelikten çok daha yüksek doğruluğa sahip olduğunu buldular.

Yazarlar, üretken yapay zekanın, geleneksel yapay zekanın yakalayamadığı süreçlerle ilgili tüm verilerin çıkarılmasına yardımcı olmak için yararlı olduğu sonucuna varıyor: “Bu, özellikle kullanıcı ifadeleri ve diğer serbest metin nitelikleri gibi kategorik özellik alanının çok büyük olduğu durumlarda yararlı.”

Diğer taraftan, SNAP’ın avantajları, çok fazla anlamsal bilgi içermeyen veri setlerini kullandığında azalıyor; başka bir deyişle, yazılı ayrıntılar.

“Bu çalışmadaki temel bulgulardan biri, SNAP’ın performansının veri kümesindeki anlamsal bilgi miktarıyla birlikte artmasıdır” diye yazıyorlar.

SNAP yaklaşımı için daha da önemlisi, yazarlar veri setlerinin robotik süreç otomasyonu gibi “kullanıcı ve sistem ifadelerinin genellikle tahminlerin doğruluğunu artırmak için kullanılabilecek zengin anlamsal bilgiler içerdiği” yeni teknolojiler tarafından giderek daha fazla geliştirilmesinin mümkün olduğunu öne sürüyorlar.

Kaynak: Tiernan Ray / ZD Net


Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, Twitter, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.

- Sponsorlu -spot_img

Daha Fazla

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

- Sponsorlu -spot_img

Son Haberler