Bir dönemde nerede yapay zeka Araçlar Sınıflarda ders kitapları kadar yaygın hale gelen yeni bir çalışma, çoğu öğrencinin aslında bunları nasıl iyi kullanacağını bilmediğini gösteriyor.
Yaygın olarak benimsenmesine rağmen üretken yapay zeka Sistemler gibi Chatgptİkizler ve Claude, araştırmacılar üniversite öğrencilerinin bu teknolojilerle etkileşime girme yeteneklerini fazla tahmin ettiklerini ve yetkinlik yanılsamasının gerçek dünya sonuçları olabileceğini buldular.
Ayarlamak Yayınlanacak Aralık 2025 sayısında Bilgisayarlar ve Eğitim: Yapay ZekaMonash Üniversitesi araştırmacılarının bir makalesi, üretken AI Okuryazarlık Değerlendirme Testini (GLAT) tanıtmaktadır. Bu öncü sınav, öğrencilerin sadece üretken AI araçlarını kullanma yeteneğini değil, aynı zamanda bunları anlamını ve etik olarak uygulama kapasitelerini değerlendirmek için tasarlanmış türünün ilk örneğidir.
Neredeyse tüm çalışma katılımcıları ile bir miktar yeterlilik talep etti AI Chatbotssadece yüksek glat skorları olanlar, AI desteğini kullanarak karmaşık verilerin analiz edilmesini gerektiren görevlerde başarılı bir şekilde gezinebildi. Buna karşılık, kendi kendine bildirilen uzmanlığın çok az öngörücü gücü yoktu.
Bu bulgu, algılanan yapay zeka okuryazarlığı ile gerçek yeterlilik arasında kritik bir boşluk olduğunu göstermektedir – biri sadece eğitim için değil, ulusal güvenlik için etkileri olan, işgücü hazırlıkve büyüyen bilgi savaşı manzara.
Özünde, çalışma, AI’ya erişimi olan veya olmayanlar arasında değil, ancak bu sistemlerin nasıl çalıştığını ve kör uçanları anlayanlar arasında yeni bir tür dijital bölünme ortaya koyuyor.
Çalışmanın yazarları, “GLAT, Genai okuryazarlığını değerlendirmek için güvenilir ve geçerli bir yöntem sunuyor” diye yazdı. “Öğrencilerin ve eğitimcilerin genai okuryazarlığını geliştirmeyi amaçlayan eğitim uygulamalarını ve politika kararlarını bilgilendirme potansiyeline sahiptir ve sonuçta AI-geliştirilmiş bir gelecekte gezinmeye çalışmaktadır.“
GLAT, diğer okuryazarlık değerlendirmelerinden ayrı duruyor çünkü öğrencilere AI araçlarıyla ne kadar kendinden emin olduklarını sormuyor. Bunun yerine, dört kritik alanda becerileri göstermelerini gerektirir:
- Büyük dil modelleri ve hızlı mühendislik gibi temel kavramları anlamak
- Gerçek dünyadaki görevlerde AI uygulamak.
- AI tarafından üretilen çıktıların doğruluğunu ve güvenilirliğini değerlendirmek
- Önyargı, gizlilik ve yanlış bilgilendirme gibi etik kaygılarda gezinme.
Çalışmaya katılanlar tabi tutuldu Dikkatle oluşturulmuş 20 çoktan seçmeli sorudan oluşan bir seriye, Pratik bilgi ve karar verme becerileri. Bununla birlikte, çalışmanın en zorlayıcı yönü, öğrencilerin simüle edilmiş bir sağlık ortamından görsel verileri analiz etmek için GPT-4O ile çalışan bir chatbot kullanılarak gerçek dünya atamasıyla görevlendirildiği ikinci aşamasıydı. Performansları daha sonra GLAT puanları ve kendi kendine değerlendirilenleri ile karşılaştırıldı Chatgpt okuryazarlık.
Sonuçlar, yüksek GLAT skorlarına sahip öğrencilerin, görsel analiz gibi alana özgü bilgiyi kontrol ederken bile AI destekli görevlerde önemli ölçüde daha iyi performans gösterdiğini ortaya koydu. Bu arada, kendilerini bildiren anketlerde kendilerini yüksek oranda derecelendiren ancak GLAT’da kötü puan alanlar, yararlı bilgileri çıkarmak veya chatbot yanıtlarındaki hataları tanımlamak için mücadele ettiler.
Başka bir deyişle, güven AI okuryazarlığı veya yetkinliği ile ilişkili değildi.
Kurumlar için bu tutarsızlık önemlidir. Üretken AI eğitim, iş ve hükümet sistemlerine daha derin yerleşik hale geldikçe, kötüye kullanım riskleriyanlış anlama veya makine çıkışlarına kör güven de çoğalır.
Önyargılı işe alım algoritmalarından AI tarafından oluşturulan dezenformasyon kampanyalarına kadar, özellikle kullanıcılar gerçek ve kurgu veya halüsinasyon ve gerçek arasında ayrım yapamazlarsa, hata marjı daralıyor.
Pentagon zaten sinyal Büyük dil modellerini savaş alanı karar verme sürecine dahil etme niyeti. Ajanslar İç Güvenlik Bakanlığı ki CIA istihbarat toplama ve tehdit değerlendirmelerini kolaylaştırmak için üretken AI kullanan denemeleri kamuoyuna kabul etmişlerdir. Bu sistemlere beslenen operatörler, AI çıktısını eleştirel olarak değerlendirmek için okuryazarlık içermiyorsa, sonuçlar felaket olabilir.
GLAT’ın arkasındaki araştırmacılar potansiyelini sadece eğitim için değil, aynı zamanda politika geliştirme ve stratejik işgücü eğitimi için de vurgulamaktadır. Test, titiz psikometrik temellere dayanmaktadır, klasik test teorisi ve madde yanıt teorisi dahil, Eğitim ölçümünde her iki altın standart. Hem iç tutarlılığı hem de dış öngörücü gücü doğrulamak için senaryo tabanlı görevler ve istatistiksel modelleme karışımı kullanılarak toplam 355 yüksek öğrenim öğrencisi olan üç grupta test edilmiştir.
GLAT’ın performansı, ortalamadan daha düşük yeterliliğe sahip olanları tanımlamada en güçlüydü-özellikle AI kötüye kullanımına en savunmasız grup. Test, okuryazarlık seviyeleri ortalamanın hemen altına düşen ve erken müdahale ve müfredat tasarımı için kritik olan öğrenciler için kesinti.
Araştırmacılar ayrıca, testin güvenilirliğini ve tek boyutluliğini sağlamak için doğrulayıcı faktör analizi ve model karşılaştırma tekniklerini kullandılar, yani aslında pratik geni okuryazarlığını ölçüyor.
Ancak en lanet olası karşılaştırma, GLAT’ın mevcut diğer tek okuryazarlık enstrümanına karşı çekildiğinde geldi: Lee ve Park tarafından geliştirilen Chatgpt Okuryazarlık Ölçeği. Glat’ın aksine, bu araç kendi raporlarına dayanmaktadır. Dağıtım daha kolay olsa da, AI destekli görsel analiz görevi sırasında öğrencilerin gerçek performansını tahmin edemedi. Buna karşılık GLAT, başarılı görev yürütme ile istatistiksel olarak anlamlı bir korelasyona sahipti.
“Genai okuryazarlığında daha fazla yeterlilik, Genai Chatbot tarafından desteklenen görevlerde gelişmiş performansla ilişkilidir.“ Araştırmacılar buldu. “ChatGPT ile kendi kendine bildirilen yeterlilik, Genai destekli görevlerde performans puanlarını tahmin etmede önemli bir faktör değildi.“
Yapay zekanın sonuçları önemlidir. Diyelim ki öğrenciler ve profesyoneller, AI araçlarıyla aşinalıkları gerçek yetkinlik ile karıştırmaya devam ediyor. Bu durumda, yanlış bilgi Veya daha kötü-güvenlik sistemlerindeki insan-ai işbirliğine bağlı kör noktalar.
Bu boşluğun daha koyu bir katmanı da var. Devlet destekli dezenformasyon birimleri de dahil olmak üzere kötü aktörler, halkın AI cehaletinden zaten yararlanıyor. Geçip geçmediği derin keklersentetik ortam veya duygusal olarak ikna edici AI tarafından üretilen anlatılar, kullanıcılar ne gördüklerini sorgulama, yorumlama ve doğrulama becerilerinden yoksunsa bu araçlar çok az dirençle silahlandırılabilir.
Halkın üretken yapay zekayı yanlış anlamasının belirgin olduğu bir alan, kullanıcıların sık sık hitap ettiği Sosyal Medya Platformu X (eski adıyla Twitter). Grok-Platforma entegre edilmiş bir AI chatbot-gerçek kontrol veya içgörü için.
Hemen hemen her viral yazının altındaki yorumlarda, kullanıcılar Grook’u anında doğrulama veya uzman analizi yapabilen her şeyi bilen bir otorite gibi etiketlerken görülebilir. Bununla birlikte, Grook bir gerçeğin ya da her şeyi bilen bir dijital zihin değildir. Bunun yerine, X kullanıcı yayınlarındaki desenlere dayalı makul sesli metinleri tahmin etmek için eğitilmiş üretken bir dil modelidir.
Diğer sohbet botları gibi, Grook da özellikle duygusal olarak yüklü veya belirsiz içerikle istendiğinde, gerçekleri üretebilir, önyargıları yansıtabilir ve yanlış anlama yapabilir. Kısa bir süre önce, önemli bir yükseltmeden sonra, sohbet botu başladı püskürtme Antisemitik nefret söylemi.
Birçok sosyal medya kullanıcısının GROK’ya kesin bir kaynak olarak davranması, birçok insanın bu sistemlerin gerçekte nasıl işlev gördüğünü ve bu kör güvenin ne kadar kolay kullanılabileceğini ne kadar az anladığını vurgulamaktadır.
Bu anlamda, GLAT bir eğitim aracından daha fazlasını temsil edebilir – dijital savunma eğitimi için bir prototip olabilir. Medya, politika ve stratejinin ön saflarında bulunanların sadece bir sohbet botunun nasıl isteneceğini değil, aynı zamanda yanlış, önyargılı veya aldatmak için nasıl kullanılacağını tespit edeceğini öğrendikleri bir tür AI savaş oyunu.
Grok’un nefret dolu mesajlar, ABD Savunma Bakanlığı’nı çalkalanmasından sadece birkaç gün sonra duyurulmuş Pentagon için yapay zeka araçları geliştirmek ve uygulamak için Elon Musk’ın Xai’ye 200 milyon dolarlık bir sözleşme yapmıştı.
Milyon dolarlık sözleşmenin zamanlaması hem endişe verici hem de derinden açıklayıcıdır. Hükümetler AI’yı askeri operasyonlara, istihbarat analizi ve kritik altyapıya entegre etmek için hareket ettikçe, bu sistemleri yanlış anlama için bahisler daha yüksek olamazdı. GROK ile ilgili olay, sadece öğrenciler ve eğitimciler için değil, politika yapıcılar, savunma yetkilileri ve genel olarak halk için güvenilir AI okuryazarlık değerlendirmeleri geliştirmenin aciliyetinin altını çiziyor.
Glat-ya da gelecekteki bir yinelemesi-sınıfın ötesinde ölçeklendirilmişse, AI operatörlerini onaylamak veya hatta daha geniş halkı AI güdümlü bir dünyada yaşam için hazırlamak için temel oluşturabilir. Çalışma bu tür önerilerde bulunmayı bırakırken, kapıyı açıkça açık bırakıyor.
“Bu çalışma, Geni okuryazarlığını güvenilir bir şekilde değerlendirmek için geleneksel kendi kendine bildirilen önlemlere ek olarak performansa dayalı değerlendirmelerin entegrasyonunu savunuyor,“ Araştırmacılar yazıyor. “Bulgular sürekli adaptasyon ihtiyacını vurgulamaktadır teknolojik gelişmelere ayak uydurmak, böylece eğitimcileri ve öğrencileri AI odaklı bir geleceğe etkili bir şekilde katılmak için gerekli becerilerle donatmak için değerlendirme araçları. ”
Tim McMillan emekli bir kolluk yöneticisi, soruşturma muhabiri ve Debey’in kurucu ortağıdır. Yazısı genellikle savunma, ulusal güvenlik, istihbarat topluluğu ve psikoloji ile ilgili konulara odaklanır. Tim’i Twitter’da takip edebilirsiniz: @Lttimmcmillan. Tim’e e -posta ile ulaşılabilir: [email protected] veya şifreli e -posta yoluyla: [email protected]








