Sırasında Perşembe günü Big GPT-5 LivestreamOpenai, modeli oldukça etkileyici hale getiren birkaç grafik gösterdi – ancak yakından bakarsanız, bazı grafikler biraz kapalı kaldı.
Birinde, ironik bir şekilde GPT-5’in “Aldatma modellerinde” ne kadar iyi olduğunu gösteriyor, ölçek her yerde. Örneğin, “Kodlama Aldatma” için sahnede gösterilen grafik, düşünme ile GPT-5’in görünüşte yüzde 50,0 aldatma oranı aldığını söylüyor, ancak bu, Openai’nin bir şekilde daha büyük bir çubuğa sahip olan daha küçük yüzde 47,4 O3 puanıyla karşılaştırıldığını söylüyor. Openai, bu grafik için doğru numaralara sahip gibi görünüyor. GPT-5 blog yazısıAncak, GPT-5’in aldatma oranının yüzde 16,5 olarak etiketlendiği.
İle Bu grafikOpenai sahnede GPT-5’in puanlarından birinin daha düşük O3’lerden daha büyük bir çubukla gösterilir. Aynı grafikte, O3 ve GPT-4O’nun puanları farklıdır, ancak eşit boyutlu çubuklarla gösterilmiştir. CEO Sam Altman’ın bunu yorumlaması yeterince kötüydü. onu çağırmak Bir “mega grafik vidası”, ancak doğru bir versiyonun Openai’nin blog gönderisinde.
Bir Openai Pazarlama Çalışanı da özür dileme“Bloglardaki grafiği düzelttik, kasıtsız grafik suçundan özür dileriz.” Diyerek.
Openai, yorum talebine hemen yanıt vermedi. Ve Openai’nin kullanıp kullanmadığı belirsiz olsa da GPT-5 Grafikleri gerçekten yapmak için, büyük lansman gününde şirket için hala harika bir görünüm değil – özellikle yeni modeliyle “halüsinasyonları azaltmada önemli ilerlemeleri” başlattığında.
Source link








