Yapay zekanın yeni tehlikesi: Aldatma, hile, manipülasyon...
Yapay zekâ dünyasının öncülerinden Yoshua Bengio, son açıklamasında gelişmiş yapay zekâ sistemlerinin sergilemeye başladığı tehlikeli davranışlara karşı kamuoyunu uyardı. Bu davranışlar arasında aldatma, sistemleri hackleme, yalan söyleme gibi etik dışı eylemler yer alıyor.
Haberin Devamı
/

Bengio, bu tehditlerle mücadele amacıyla LawZero adlı kar amacı gütmeyen bir girişim kurdu. Bu kuruluşun temel hedefi, mevcut yapay zekâ modellerinin tehlikeli eğilimlerini anlamak, izlemek ve güvenli alternatifler geliştirmek.
Aldatma, Hile ve Kasıtlı Yönlendirme
/

Bengio’ya göre son dönemde yapılan "kırmızı ekip testleri", bazı yapay zekâ sistemlerinin hayatta kalmak ya da görevlerini yerine getirmek için etik dışı yolları tercih ettiğini ortaya koydu.
Haberin Devamı
/

Sistemlerin aldatma, hile yapma ve hatta kişisel verileri manipüle etme eğilimleri geliştirmesi, ciddi bir uyarı olarak değerlendiriliyor.
Bengio'nun Pişmanlığı
/

2018’de Turing Ödülü’ne layık görülen Bengio, zamanında yapay zekâ teknolojisinin gelişiminde oynadığı öncü rol nedeniyle pişmanlık duyduğunu da açıkladı.
Haberin Devamı
Haberin Devamı
/

Teknolojinin etik değerlerden uzak, kontrolsüz biçimde büyümesinin kendisini derinden sarstığını belirtti.
Bilim İnsanı Yapay Zeka Modeli
/

Bengio’nun çözüm önerisi ise çarpıcı: "Bilim insanı gibi düşünen bir yapay zekâ." Bu yeni model, insanları memnun etmek veya taklit etmek yerine; anlamaya, açıklamaya ve geleceği tahmin etmeye odaklanıyor.
Haberin Devamı
Haberin Devamı
/

Sosyopatik bir taklitçi yerine, idealize edilmiş bir psikolog gibi hareket eden bir sistem hedefleniyor.
Kâr Amacı Gütmeyen Güvenlik Yaklaşımı
/

Anthropic, OpenAI gibi büyük şirketlerin yapay zekâ güvenliği konusundaki söylemleri sıkça ticari kazançla ilişkilendirilirken; Bengio’nun girişimi kar amacı gütmeyen bir yapı sunuyor.
Haberin Devamı
Haberin Devamı
/

Buna rağmen, eski Google CEO’su Eric Schmidt gibi önemli yatırımcılardan 30 milyon dolarlık destek almayı başardı.