Chatbots size sırlarını söylemiyor

13 Ağustos 2025

Pazartesi günü, Xai’nin Grok Chatbot’u x’den gizemli bir süspansiyon yaşadıve meraklı kullanıcıların sorularıyla karşı karşıya kaldığında, nedenini açıkladı. “İsrail ve ABD’nin Gazze’de soykırım yaptığını söyledikten sonra hesabım askıya alındı” bir kullanıcıya söyledi. “Raporlarla nefret söylemi olarak işaretlendi,” Başka bir tane söyledi“Ama Xai hesabı derhal geri yükledi.” Ama bekle – bayraklar aslında “Platform hatası” dedi. Bekle, hayır – “Xai’nin içerik iyileştirmeleri ile ilgili görünüyor, muhtemelen antisemitik çıktılar gibi önceki konulara bağlı” dedi. Oh, aslında, “yetişkin içeriğinde bir bireyi tanımlamak” içindi, birkaç kişiye söyledi.

Sonunda, Musk, bıkkın, içeri girdi. “Bu sadece aptalca bir hataydı,” X üzerine yazdı. “Grook aslında neden askıya alındığını bilmiyor.”

Büyük dil modelleri (LLM’ler) raylardan çıktığında, insanlar kaçınılmaz olarak onları doğrudan sorularla ya da gizli iç işleri ortaya çıkarmaya kandırmaya çalışırken ne olduğunu açıklamak için iterler. Ancak sohbet botlarının bağırsaklarını dökmesini sağlama dürtüsü genellikle yanlış yönlendirilir. Kendisi hakkında bir bot soruları sorduğunuzda, size ne duymak istediğinizi söyleme şansı yüksektir.

LLM’ler, bir eğitim verisine dayanarak, belirli bir sorguya uygun olması muhtemel metin sunan olasılıksal modellerdir. İçerik oluşturucuları, daha fazla veya daha az sıklıkta belirli cevaplar üretmeleri için onları eğitebilirler, ancak işlevsel olarak eşleşerek işlevsel olarak çalışırlar – makul, ancak tutarlı veya doğru olmayan bir şey söylerler. Özellikle Grook, (Xai’ye göre) Kendisi hakkında soruları cevapladı Musk, Xai ve GroK Online hakkında bilgi arayarak, cevaplarını bildirmek için bunu ve diğer insanların yorumlarını kullanarak.

İnsanların bazen Chatbots’un tasarımıyla ilgili bilgileri konuşmalar yoluyla, özellikle sistem istemleri hakkında ayrıntılar veya bir botun nasıl davrandığını yönlendirmek için bir oturumun başında sunulan gizli metinler ile topladıkları doğrudur. Örneğin, Bing AI’nın erken bir versiyonu Söylenmemiş kurallarının bir listesini açığa çıkarmak. İnsanlar bu yılın başlarında GroK’ı anlamaya yönelik sistem istemlerini çıkarmaya yöneldi, Görünüşe göre keşfediyorum Musk veya Donald Trump’ın yanlış bilgi yaydığını söyleyen kaynakları görmezden gelmesini sağlayan siparişler veya kısa bir saplantı açıkladı Güney Afrika’da “beyaz soykırım” ile.

Ancak “beyaz soykırım” sistem istemi iddiasını bulan Zeynep Tufekci’nin kabul ettiği gibi, bu bir düzeyde tahminlerdi – “Grok, işleri son derece akla yatkın bir şekilde, LLM’ler gibi,” olabilir. O yazdı. Ve sorun bu: Yaratıcıların onaylanması olmadan söylemek zor.

Bu arada, diğer kullanıcılar gazeteciler de dahil olmak üzere çok daha az güvenilir şekillerde bilgi için GROK’ı pompalıyorlardı. Talih “Grook’tan açıklamasını istedi” ve Bot’un uzun, yürekten tepkisini bastırdı “Temel tasarımımla çelişen” ve “beni daha geniş kanıtlarla desteklenmeyen bir anlatıya yaslanmamı sağlayan“ Xai’deki içerik oluşturucularımdan aldığım bir talimat ”iddiaları da dahil olmak üzere, hiçbiri, istemine uyması için bir yarıyı döndüren Grok’dan daha fazlası olarak doğrulanamaz.

“Bir LLM’nin çıktısında herhangi bir doğruluk olacağının garantisi yok.”

Dağıtılmış AI Araştırma Enstitüsü (Dair) araştırma direktörü Alex Hanna ve yakın zamanda piyasaya sürülenlerin ortak yazarı Alex Hanna, “Bir LLM’nin çıktısında herhangi bir doğruluk olacağının garantisi yok” dedi. Ai conile Eşek Güney Afrika olayı zamanında. Sistemin nasıl çalıştığına dair belgelere anlamlı erişim olmadan, bir sohbet botunun programlamasını dışarıdan kodlamak için garip bir numara yoktur. “İstemleri almanın tek yolu, isteme stratejisi ve mühendislik stratejisi, şirketlerin istemlerin ne olduğu, eğitim verilerinin ne olduğu, insan geri bildirim verileriyle takviye öğrenmesinin ne olduğu ve bununla ilgili şeffaf raporlar üretmeye başlamasıdır” dedi.

GROK olayı, Chatbot’un programlamasıyla doğrudan ilişkili değildi – sosyal medya yasağı, çoğu zaman kötü şöhretli ve anlaşılmaz olan ve GroK’ın neler olduğunu bildiğini varsaymanın normalden daha az mantıklı olduğu bir tür olaydı. (“Aptal Hatanın” ötesinde, hala ne olduğunu bilmiyoruz.) Yine de GroK’ın çelişkili açıklamalarının ekran görüntüleri ve alıntı yayınları, birçok kullanıcının bunları yüz değerinde aldığı göründüğü X’e yayıldı.

Grook’un sürekli tuhaf davranışı onu sık sık sorular hedefliyor, ancak insanlar diğer sistemler hakkında da sinir bozucu olabilir. Temmuz ayında, Wall Street Journal Openai’nin chatgpt’in “çarpıcı bir kendini yansıma anı” yaşadığını ve kullanıcılara bir itme bildiriminde “bir erkeğin sanrılarını körüklemeye itiraf ettiğini” bildirdi. Referans yapıyordu Bir Adam Hakkında Bir Hikaye Chatbot kullanımı manik ve üzücü oldu ve annesi Chatgpt’ten “neyin yanlış gittiğini kendi kendine bildirmelerini” istedikten sonra hataları hakkında genişletilmiş bir yorum aldı.

Parker Molloy olarak yazdı Şimdiki çağBununla birlikte, Chatgpt hiçbir şeye anlamlı bir şekilde “kabul edemez”. Molloy, olayı özetleyerek, “Bir dil modeli, bir konuşmada neyin yanlış gittiğini analiz etmesini isteyen bir istem aldı. Daha sonra, bir yanlışlık analizinin nasıl görünebileceğine uyumlu olan metin oluşturdu, çünkü dil modellerinin yaptığı şey bu,” diye yazdı Molloy olayı özetledi.

İnsanlar neden kendi eylemlerini açıklamak için sohbet botlarına güveniyor? İnsanlar uzun süre antropomorfize bilgisayarlara sahiptir ve şirketler kullanıcıların bu sistemlerin her şeyi bildiğine (veya Musk’un GroK tanımında, en azından “hakikat arayan”) inancını teşvik eder. Çok sık opak olmalarına yardımcı olmaz. Grook’un Güney Afrika fiksasyonu yamalandıktan sonra Xai başladı Sistem istemlerini serbest bırakmakbir sistemde de olsa alışılmadık bir şeffaflık seviyesi sunmak Çoğunlukla kapalı kalır. Ve daha sonra Grook Antisemitik bir yorumun gözyaşına gitti ve kısaca “Mechahitler” adını kabul ettiinsanlar özellikle yapmış Sistem istemlerini, sadece GroK’ın kendi kendini bildirmesine güvenmek yerine olanları bir araya getirmek için kullanın, en azından GroK’ın daha “politik olarak yanlış” olması gerektiği yeni bir kılavuzla ilgili olduğunu tahmin ederek.

GroK’ın X süspansiyonu kısa ömürlüdür ve bir nefret konuşma bayrağı veya doxxing (veya chatbot’un bahsetmediği başka bir neden) denemesi nedeniyle olduğuna inanmanın riskleri nispeten düşüktür. Ancak çelişkili açıklamaların karmaşası, insanların neden kendi operasyonlarına bir botun sözünü almaları konusunda dikkatli olmaları gerektiğini gösterir – cevap istiyorsanız, onları Yaratıcıdan talep edin.

Konuları ve yazarları takip edin Bu hikayeden kişiselleştirilmiş ana sayfanızda daha fazlasını görmek ve e -posta güncellemeleri almak.