Teksas devlet sınavlarında not vermek için yapay zekayı kullanacak

Bu yazıda neler var?

ABD Teksas Eğitim Ajansı (TEA – The Texas Education Agency) puanlama sisteminde Üretken Yapay Zekayı (Gen AI) test ediyor. Yeni notlandırma tekniği, kullanıcıları anlamak ve onlarla iletişim kurmak için OpenAI’nin ChatGPT’si gibi sohbet robotlarını kullanacak.

Teksas, bu yıl çok daha az sayıda insan değerlendiriciyi işe alacak, çünkü onları yapay zeka destekli yeni bir puanlama sistemiyle değiştiriyor. Teksas Eyaleti Akademik Hazırlık Değerlendirmeleri (STAAR) sınavları, insan değerlendiricilerin çoğunun Gen AI ile değiştirilmesi için bir test tezgahı olabilir.

Teksas, Gen AI puanlama sistemini eğitiyor

Teksas Eğitim Ajansı, “Teksas Eyaleti Akademik Hazırlık Değerlendirmesinde okuma, yazma, fen ve sosyal bilgiler için açık uçlu sorular için otomatik bir puanlama motorunu kullanıma sunduğunu” doğruladı.

Bu yıl Teksas’ta devlet tarafından zorunlu kılınan sınavlar tarihi nitelikte olacak. Bu hafta STAAR sınavlarına girecek öğrenciler, geçen yıla kıyasla çok daha az sayıda insan değerlendiriciye sahip olacak. Genellikle Generative AI olarak adlandırılan bir doğal dil işleme motoru, cevaplarının çoğunu değerlendirecek.

STAAR sınavı, öğrencilerin devlet tarafından zorunlu kılınan çekirdek müfredatı anlamalarını ölçüyor. Teksas eyaleti bu sınavı geçen yıl yeniden tasarladı. İlginç bir şekilde, testte artık çoktan seçmeli sorular çok daha az. Teksas bunların yerine “açık uçlu sorular” ya da “yapılandırılmış yanıt maddeleri” koydu.

Texas is rolling out an “automated scoring engine” to score the STAAR test. The technology, which uses natural language processing, a building block of AI chatbots, will save the state $15-20 million. But some educators are worried.

New in @TexasTribune https://t.co/Tu36tmF5B7

— Keaton Peters (@KeatonPeters) April 10, 2024

Texas Tribune’e göre, yeni getirilen açık uçlu sorularda “altı ila yedi kat daha fazla yapılandırılmış yanıt maddesi” olacak.

İLGİLİ YAZI : LinkedIn, yapay zeka destekli içerik oluşturmayla Premium Şirket Sayfası aboneliğini test ediyor

Basitçe ifade etmek gerekirse, bu tür açık uçlu sorular, çoktan seçmeli bir sorudaki tek bir yanıta kıyasla, kabul edilebilir birkaç yanıta sahip. Teksas Eğitim Ajansı öğrenci değerlendirme direktörü Jose Rios, sonuç olarak bu tür soruların puanlanması için çok daha fazla zamana ve değerlendiriciye ihtiyaç duyulduğunu belirtiyor.

Başka bir deyişle, bu sorular not vermenin karmaşıklığını önemli ölçüde artırıyor. İşte bu noktada Gen AI gerçekten parlıyor. ChatGPT gibi platformlar, karmaşık sorguları birden fazla basitlik ve derinlik düzeyinde yanıtlama konusunda kanıtlanmış bir geçmişe sahip.

20 milyon dolar tasarruf

TEA, Gen AI puanlama sistemini 3.000 yanıt kullanarak eğitti. Bir güvenlik önlemi olarak, Gen AI iki tur insan puanlamasından geçmiş yanıtlara maruz bırakıldı. Yapay zeka puanlama motorunun yanıtların özelliklerini öğrendiği ve bir insanın vereceği puanların aynısını vermek üzere programlandığı bildirildi.

Texan children taking the STAAR test will apparently be graded by AI. If you disagree with your child’s score, they’ll gladly grade it again with a human grader – for $50.#STAAR #Texas https://t.co/6Qr36uCYaU

— no, this is just soup for my family🐀 (@SeanxTyler) April 10, 2024

İnsan değerlendiriciler, bilgisayar tarafından puanlanan tüm sonuçların dörtte birini yeniden değerlendirecek. Ayrıca, argo veya İngilizce olmayan yanıtlar gibi yapay zeka puanlama sisteminin kafasını karıştırabilecek bazı yanıtlar insan değerlendiricilere aktarılacak.

TEA, geçici insan puanlayıcılara olan ihtiyacı azaltarak yılda 15-20 milyon dolar tasarruf edeceğini tahmin ediyor. İstatistiksel olarak konuşmak gerekirse, Teksas bu yıl 2,000’den az insan değerlendiriciyi işe almayı planlıyor. Lone Star Eyaleti 2023 yılında aynı sınav için yaklaşık 6.000 değerlendirici işe aldı. Bazı eğitimcilerin yeni değerlendirme tekniğiyle ilgili endişelerini dile getirdiklerini söylemeye gerek yok.

The digital era has dawned on the Texas #STAAR test. In December 2023, the results of the first computer-graded written responses came to light. With the new grading system, 79% of testers scored a zero. Only 8% of testers scored a zero in a previous test with human graders.#TxEd pic.twitter.com/Kwj7FYUh16

— RaiseYourHandTexas (@RYHTexas) April 10, 2024

Kaynak: Alap Naik Desai / Android Headliness

Yapayzeka.news’in hiçbir güncellemesini kaçırmamak için bizi Facebook, X (Twitter), Bluesky, LinkedIn, Instagram‘ ve Whatsapp Kanalımız‘dan takip edin.

Teksas, devlet tarafından zorunlu kılınan sınavlara not vermek için yapay zeka puanlama sistemi kullanacak

Mutlaka Okumalısın

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

Teksas, Gen AI puanlama sistemini eğitiyor

20 milyon dolar tasarruf

Daha Fazla

CEVAP VER İptal

Son Haberler

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor

OpenAI’ın bir başka baş güvenlik araştırmacısı Lilian Weng de ayrıldı

Google, Workspace paketine Vids AI video oluşturma aracını ekledi

KLING AI video oluşturucusu kullanıcıların kendi AI video karakterlerini eğitmelerine olanak tanıyor

Popüler

Kurumsal

Son Yorumlar

Son Yazılar

Perplexity, yapay zeka yanıt platformuna tek tıkla alışveriş özelliğini ekliyor

Microsoft, shawarma sipariş edebilen ve insanlardan yardım isteyebilen yapay zeka ajanlarını test ediyor