MIT araştırmacıları veritabanları için üretken yapay zekayı tanıttı

Bu yazıda neler var?

Yeni bir araç, veritabanı kullanıcılarının sahne arkasında neler olup bittiğini bilmelerine gerek kalmadan tablo halindeki verilerin karmaşık istatistiksel analizlerini gerçekleştirmelerini kolaylaştırıyor.

Veritabanları için üretken bir yapay zeka sistemi olan GenSQL, kullanıcıların birkaç tuş vuruşuyla tahminlerde bulunmasına, anormallikleri tespit etmesine, eksik değerleri tahmin etmesine, hataları düzeltmesine veya sentetik veri üretmesine yardımcı olabilir.

Örneğin, sistem her zaman yüksek tansiyonu olan bir hastanın tıbbi verilerini analiz etmek için kullanılsaydı, o hasta için düşük olan ancak normal aralıkta olan bir tansiyon değerini yakalayabilirdi.

GenSQL, belirsizliği hesaba katabilen ve yeni verilere göre karar alma süreçlerini ayarlayabilen tablosal bir veri kümesini ve üretken olasılıklı bir yapay zeka modelini otomatik olarak entegre eder.

Ayrıca, GenSQL bir veritabanındaki gerçek verileri taklit eden sentetik verileri üretmek ve analiz etmek için kullanılabilir. Bu, hassas verilerin paylaşılamadığı durumlarda, örneğin hasta sağlık kayıtları veya gerçek verilerin seyrek olduğu durumlarda özellikle yararlı olabilir.

Bu yeni araç, 1970’lerin sonlarında tanıtılan ve dünya çapında milyonlarca geliştirici tarafından kullanılan veritabanı oluşturma ve düzenleme programlama dili SQL üzerine inşa edilmiştir.

“Tarihsel olarak SQL, iş dünyasına bir bilgisayarın neler yapabileceğini öğretti. Özel programlar yazmaları gerekmiyordu, sadece yüksek seviyeli bir dilde bir veritabanına sorular sormaları gerekiyordu. Sadece veri sorgulamaktan model ve veri soruları sormaya geçtiğimizde, insanlara verilerin olasılıksal bir modeline sahip bir bilgisayara sorabileceğiniz tutarlı soruları öğreten benzer bir dile ihtiyaç duyacağımızı düşünüyoruz,” diyor Vikash Mansinghka ’05, MEng ’09, PhD ’09, GenSQL’i tanıtan bir makalenin kıdemli yazarı ve MIT Beyin ve Bilişsel Bilimler Bölümü’nde Olasılıksal Hesaplama Projesi’nin baş araştırma bilimcisi ve lideri.

İLGİLİ YAZI : Microsoft yapay zeka destekli 'Finans için Copilot'u piyasaya sürdü

Araştırmacılar GenSQL’i veri analizi için popüler, AI tabanlı yaklaşımlarla karşılaştırdıklarında, yalnızca daha hızlı olmadığını, aynı zamanda daha doğru sonuçlar ürettiğini buldular. Daha da önemlisi, GenSQL tarafından kullanılan olasılıklı modeller açıklanabilirdir, böylece kullanıcılar bunları okuyabilir ve düzenleyebilir.

“Verilere bakmak ve sadece bazı basit istatistiksel kuralları kullanarak bazı anlamlı kalıplar bulmaya çalışmak önemli etkileşimleri kaçırabilir. Bir modelde değişkenlerin korelasyonlarını ve bağımlılıklarını gerçekten yakalamak istersiniz, ki bu oldukça karmaşık olabilir. GenSQL ile, çok sayıda kullanıcının tüm ayrıntıları bilmeden verilerini ve modellerini sorgulamasını sağlamak istiyoruz,” diye ekliyor baş yazar Mathieu Huot, Beyin ve Bilişsel Bilimler Bölümü’nde araştırma bilimcisi ve Olasılıksal Hesaplama Projesi üyesi.

Makalede onlara MIT lisansüstü öğrencileri Matin Ghavami ve Alexander Lew; araştırma bilimcisi Cameron Freer; Digital Garage’dan Ulrich Schaechtel ve Zane Shelby; Elektrik Mühendisliği ve Bilgisayar Bilimi Bölümü’nde MIT profesörü ve Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı (CSAIL) üyesi Martin Rinard; ve Carnegie Mellon Üniversitesi’nde yardımcı doçent olan Feras Saad ’15, MEng ’16, PhD ’22 katılıyor. Araştırma yakın zamanda ACM Programlama Dili Tasarımı ve Uygulaması Konferansı’nda sunuldu.

Modelleri ve veritabanlarını birleştirme

Yapılandırılmış sorgu dili anlamına gelen SQL, bir veritabanındaki bilgileri depolamak ve düzenlemek için kullanılan bir programlama dilidir. SQL’de, kişiler anahtar sözcükler kullanarak, örneğin veritabanı kayıtlarını toplayarak, filtreleyerek veya gruplayarak veriler hakkında sorular sorabilirler.

Ancak, bir modeli sorgulamak daha derin içgörüler sağlayabilir, çünkü modeller bir birey için verinin ne anlama geldiğini yakalayabilir. Örneğin, az maaş alıp almadığını merak eden bir kadın geliştirici, veritabanı kayıtlarındaki eğilimlerden ziyade maaş verilerinin kendisi için ne anlama geldiğiyle daha fazla ilgilenebilir.

Araştırmacılar, SQL’in olasılıksal yapay zeka modellerini dahil etmenin etkili bir yolunu sağlamadığını fark ettiler, ancak aynı zamanda çıkarımlar yapmak için olasılıksal modeller kullanan yaklaşımların karmaşık veritabanı sorgularını desteklemediğini gördüler.

İLGİLİ YAZI : Anthropic, GitHub entegrasyonu ve 500K içerik penceresi ile Claude Enterprise Plan'ı başlattı

Bu boşluğu doldurmak için GenSQL’i oluşturdular ve bu sayede basit ama güçlü bir resmi programlama dili kullanarak hem bir veri kümesine hem de olasılıksal bir modele sorgu gönderebiliyorlar.

Bir GenSQL kullanıcısı, sistemin otomatik olarak entegre ettiği verilerini ve olasılık modelini yükler. Daha sonra, sahne arkasında çalışan olasılık modelinden girdi alan veriler üzerinde sorgular çalıştırabilir. Bu, yalnızca daha karmaşık sorguları etkinleştirmekle kalmaz, aynı zamanda daha doğru yanıtlar da sağlayabilir.

Örneğin, GenSQL’deki bir sorgu, “Seattle’dan bir geliştiricinin Rust programlama dilini bilme olasılığı nedir?” gibi bir şey olabilir. Bir veritabanındaki sütunlar arasındaki korelasyona bakmak, ince bağımlılıkları gözden kaçırabilir. Olasılıksal bir modelin dahil edilmesi, daha karmaşık etkileşimleri yakalayabilir.

Ayrıca, GenSQL’in kullandığı olasılıksal modeller denetlenebilirdir, böylece insanlar modelin karar alma için hangi verileri kullandığını görebilir. Ayrıca, bu modeller her bir yanıtla birlikte kalibre edilmiş belirsizlik ölçümleri sağlar.

Örneğin, bu kalibre edilmiş belirsizlikle, veri setinde yeterince temsil edilmeyen bir azınlık grubundan bir hasta için farklı kanser tedavilerinin öngörülen sonuçları için modele sorgu yapıldığında, GenSQL, aşırı özgüvenle yanlış tedaviyi savunmak yerine, kullanıcıya belirsiz olduğunu ve ne kadar belirsiz olduğunu söyler.

Daha hızlı ve daha doğru sonuçlar

GenSQL’i değerlendirmek için araştırmacılar sistemlerini sinir ağlarını kullanan popüler temel yöntemlerle karşılaştırdılar. GenSQL bu yaklaşımlardan 1,7 ila 6,8 kat daha hızlıydı ve çoğu sorguyu birkaç milisaniyede yürütürken daha doğru sonuçlar sağlıyordu.

Ayrıca iki vaka çalışmasında GenSQL uyguladılar: birincisinde sistem yanlış etiketlenmiş klinik deney verilerini belirledi, diğerinde ise genomikteki karmaşık ilişkileri yakalayan doğru sentetik veriler üretti.

Araştırmacılar daha sonra, insan popülasyonlarının büyük ölçekli modellemesini yürütmek için GenSQL’i daha geniş bir şekilde uygulamak istiyorlar. GenSQL ile, analizde hangi bilgilerin kullanılacağını kontrol ederken sağlık ve maaş gibi şeyler hakkında çıkarımlar yapmak için sentetik veriler üretebilirler.

İLGİLİ YAZI : DeepMind ve YouTube, Lyria ve Dream Track'i piyasaya sürdü

Ayrıca sisteme yeni optimizasyonlar ve otomasyonlar ekleyerek GenSQL’i daha kolay kullanılır ve daha güçlü hale getirmek istiyorlar. Uzun vadede araştırmacılar kullanıcıların GenSQL’de doğal dil sorguları yapabilmesini sağlamak istiyorlar. Amaçları, sonunda herhangi bir veritabanı hakkında konuşulabilecek, cevaplarını GenSQL sorguları kullanarak temellendiren ChatGPT benzeri bir AI uzmanı geliştirmek.

Bu araştırmanın finansmanı kısmen Savunma İleri Araştırma Projeleri Ajansı (DARPA), Google ve Siegel Aile Vakfı tarafından sağlanıyor.

Kaynak: MIT

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram ve Whatsapp Kanalımız‘dan takip edin.

MIT araştırmacıları veritabanları için üretken yapay zekayı tanıttı

Mutlaka Okumalısın

Z kuşağına yönelik yaratıcı, yapay zeka destekli mesajlaşma uygulaması: Daze

ChatGPT Windows’a geliyor

Janus, yenilikçi mimari aracılığıyla çok modlu anlayışı ve görsel üretimi bir araya getiriyor

Google, NotebookLM dakikasını bir ChatGPT anına dönüştürmek istiyor

Modelleri ve veritabanlarını birleştirme

Daha hızlı ve daha doğru sonuçlar

Daha Fazla

CEVAP VER İptal

Son Haberler

Z kuşağına yönelik yaratıcı, yapay zeka destekli mesajlaşma uygulaması: Daze

ChatGPT Windows’a geliyor

Janus, yenilikçi mimari aracılığıyla çok modlu anlayışı ve görsel üretimi bir araya getiriyor

Google, NotebookLM dakikasını bir ChatGPT anına dönüştürmek istiyor

Perplexity, şirketler için ‘Dahili Bilgi Arama’yı tanıttı

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Z kuşağına yönelik yaratıcı, yapay zeka destekli mesajlaşma uygulaması: Daze

ChatGPT Windows’a geliyor