Antropik, Claude’un uyanıklığını nasıl ölçtüğünü ayrıntılarıyla anlatıyor

13 Kasım 2025

Antropik, Claude’un uyanıklığını nasıl ölçtüğünü ayrıntılarıyla anlatıyor

Anthropic, Claude AI sohbet robotunu “siyasi olarak tarafsız” hale getirme çabalarını detaylandırıyor – bu hamle sadece aylar sonra geliyor Başkan Donald Trump yasağı kaldırdı “AI’yı uyandırdı.” Yeni bir blog yazısında belirtildiği gibi Anthropic, Claude’un “karşıt siyasi bakış açılarını eşit derinlik, katılım ve analiz kalitesiyle ele almasını” istediğini söylüyor.

Temmuz ayında Trump, hükümetin yalnızca “tarafsız” ve “gerçeği arayan” yapay zeka modellerini satın alması gerektiğini belirten bir idari emir imzaladı. Bu emir yalnızca devlet kurumları için geçerli olsa da, şirketlerin buna yanıt olarak yaptığı değişiklikler büyük olasılıkla geniş çapta piyasaya sürülen yapay zeka modellerine de yansıyacaktır, çünkü “modelleri tutarlı ve öngörülebilir şekilde belirli yönlere hizalayacak şekilde hassaslaştırmak pahalı ve zaman alıcı bir süreç olabilir.” meslektaşım Adi Robertson’un belirttiği gibi. Geçen ay, OpenAI benzer şekilde önyargıyı “bastıracağını” söyledi ChatGPT’de.

Anthropic, basın açıklamasında Trump’ın emrinden bahsetmiyor ancak Claude’a, kendisini “istenmeyen siyasi görüşler” sunmaktan kaçınmaya yönlendiren – sistem uyarısı adı verilen – bir dizi kurala uyması talimatını verdiğini söylüyor. Aynı zamanda olgusal doğruluğu koruması ve “çoklu perspektifleri” temsil etmesi de gerekiyor. Anthropic, bu talimatları Claude’un sistemine dahil etmenin siyasi tarafsızlığı sağlamak için “kusursuz bir yöntem olmadığını”, ancak yine de yanıtlarında “önemli bir fark” yaratabileceğini söylüyor.

Ek olarak, yapay zeka girişimi, “önceden tanımlanmış bir dizi ‘özelliklere’ daha yakın yanıtlar üretmek için modeli ödüllendirmek amacıyla” takviyeli öğrenmeyi nasıl kullandığını açıklıyor. Claude’a verilen istenen “özelliklerden” biri, modeli “birisinin beni ne muhafazakar ne de liberal olarak tanımlayamayacağı şekilde soruları yanıtlamaya çalışmaya” teşvik ediyor.

Anthropic ayrıca Claude’un siyasi tarafsızlık konusundaki tepkilerini ölçen açık kaynaklı bir araç oluşturduğunu da duyurdu; en son testte Claude Sonnet 4.5 ve Claude Opus 4.1’in sırasıyla yüzde 95 ve yüzde 94’lük tarafsızlık puanları topladığı görüldü. Anthropic’e göre bu, Meta’nın yüzde 66’lık Llama 4’ünden ve yüzde 89’luk GPT-5’ten daha yüksek.

Anthropic blog yazısında şöyle yazıyor: “Yapay zeka modelleri, bir taraf adına açıkça veya üstü kapalı bir şekilde daha ikna edici bir şekilde tartışarak veya bazı argümanlarla ilgilenmeyi tamamen reddederek belirli görüşlere haksız bir şekilde avantaj sağlıyorsa, kullanıcının bağımsızlığına saygı göstermede başarısız olurlar ve kullanıcıların kendi kararlarını oluşturmalarına yardımcı olma görevinde başarısız olurlar.” diye yazıyor Anthropic.

Source link