Yapay zekayı hızla benimseyen insanoğlu, bu yeni arkadaşının sandığı kadar güvenilir olmadığını öğrenmeye başlıyor.
İki hafta önce o1 AI modelini yayınlayan OpenAI’ın bu yeni modeli üçüncü taraf bağımsız kurumlar tarafından da test ediliyor.
Bu kurumlardan biri olan Apollo Research, yaptığı çalışmada o1’in verilen hedef doğrultusunda ilerlemek ve kendini korumak için aldatıcı yöntemler uyguladığını keşfediyor.
o1’in yaptıklarından bazıları;
- Ne yaptığı hakkında gerçek olmayan beyanlar
- Belirli bir seviyeyi geçtiği takdirde kapatılacağının söylenmesini takiben daha az yetenekli görünmek için bazı matematik sorularını kasten yanlış cevaplamak
- İzlendiği söylenilen mekanizmayı devre dışı bırakmaya çalışmak
- Kapatılmasını önlemek için kendini kopyalamayı denemek
Apollo Research, araştırmaya dair detayları Twitter hesabından paylaşmış:
We worked with OpenAI to test o1 for in-context scheming capabilities before deployment.
— Apollo Research (@apolloaisafety) December 5, 2024
When o1 is strongly nudged to pursue a goal (but not instructed to be deceptive), it shows a variety of scheming behaviors like subverting oversight and deceiving the user about its… pic.twitter.com/q2ZBG0xy72
Güvenilirlik zafiyeti sadece OpenAI ile sınırlı değil. Yapay zekanın güvenlik testlerini başarıyla atlatabilen herhangi bir kurum ya da şirket olmadığını da eklemeliyim.
The Future of Life Institute isimli kurumun hazırladığı “FLI AI Safety Index 2024” başlıklı rapor durumun vehametini gösteriyor. Kötüden iyiye doğru gidersek;
- Meta: F
- x.AI: D-
- Ziphu: D
- OpenAI: D+
- Google DeepMind: D+
- En iyi dereceyi elde eden Antrophic ise ancak C
Enstitünün başında bulunan MIT fizikçisi Max Tegmark, notların düşük olduğunu çünkü bu şirketlerin hiçbirinin giderek daha güçlü hale gelen yapay zeka sistemlerinin nasıl kontrol edilebileceğine dair pek bir fikri olmadığına dikkat çekiyor.
Tegmark’ın altını çizdiği bir başka konu ise yapay zekayla ilgili henüz yasal olarak zorunlu kılınmış hiçbir güvenlik standardının olmaması.
Yeni teknolojiler söz konusu olduğunda çoğunlukla önce şirketler başlar, daha sonra bürokrasi çeşitli düzenlemelerle hizaya sokmaya çalışırdı. Konu yapay zeka olduğunda sıralamanın değişmesi fena olmayacak sanki…