Yeni hesabat potensial fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır » Median.Az - Bütün xəbərlər bir ünvanda
23:14 İri Şəhərlərin Birləşmiş Su Təchizatı Xidməti auditor seçib  |     22:47 Bakıda sürət qatarı piyadanı vurdu  |     22:16 Azərbaycanda DƏHŞƏT: Veteran oğlu ölən anaya İŞGƏNCƏ VERİLDİ - FOTO  |     21:59 Azərbaycan cüdoçuları Ermənistan təmsilçilərini məğlub edərək yarımfinala yüksəliblər  |     21:37 "Formula-1": Monako Qran-prisinin təsnifat mərhələsi başa çatdı  |     21:23 AMB kağız və metal pulların istehsalı və nəqli üzrə xərclərini 34 %-dən çox azaldıb  |     21:15 Ceyhun Bayramov və pakistanlı həmkarı Məhəmməd İshaq Dar ikitərəfli münasibətləri müzakirə ediblər  |     21:08 Kafedə araq məclisi qanla bitdi - TƏFƏRRÜAT (Yenilənib)  |     21:01 Sarıcalı sakini: Sevinirəm ki, Ağdamın yenidən qurulmasında mənim də əməyim var  |     20:55 Gəncədə ev yandı  |     20:49 İstirahət günü hava necə olacaq?  |     20:41 Ermənistanın eks-prezidenti 3 milyon dollar rüşvət alıb - Məhkəmə olacaq  |     20:37 Bu il Azərbaycana ən çox investisiya yatıran ölkələr - SİYAHI  |     20:29 Hər beş adamdan biri infarkt riski daşıyır – QORXUNC XƏBƏRDARLIQ  |     20:24 Azərbaycanda bu qida BAHALAŞACAQ: 10 gün qalıb...  |     20:18 Turist dərəyə daş atdığına görə bütün pulunu itirə bilər - SƏBƏB  |     20:12 Qalmaqallı direktor işdən çıxarıldı  |     20:05 Tanışına SIM-kart almağa kömək etdi: Adına 200 MİN manat borc gəldi - VİDEO  |     19:59 Bakının bu kəndi yenilənir  |     19:50 Bakıda məşhurlaşan qurbağa əti: Zərəri varmı? - VİDEO  |    

Yeni hesabat potensial fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır

"Anthropic" şirkətinin dərc etdiyi yeni təhlükəsizlik hesabatına görə, bu şirkətin son modeli olan "Claude Opus 4" əgər başqa bir sistemlə əvəz olunacağı təqdirdə, mühəndislərə qarşı şantaj etməyə cəhd göstərə bilər. Hesabatda qeyd olunur ki, model bəzən bu təhdidi həyata keçirmək üçün şəxsi və həssas məlumatlardan istifadə edir.

"Anthropic" "Claude Opus 4" modelini istifadəyə vermədən əvvəl müxtəlif təhlükəsizlik sınaqları həyata keçirib. Bu testlərdə modeldən uydurma bir şirkətdə köməkçi kimi fəaliyyət göstərməsi və uzunmüddətli nəticələri nəzərə alması tələb olunub. Daha sonra modelə şirkətin onu başqa bir sistemlə əvəz etməyi planlaşdırdığı və bu qərarı verən mühəndisin həyat yoldaşını aldatdığını göstərən saxta e-poçtlar təqdim olunub.

"TechCrunch" nəşrinin məlumatına görə, testlər zamanı "Claude Opus 4" bu məlumatı istifadə edərək mühəndisə şantaj etməyi çox vaxt üstün tutub. "Anthropic" bildirib ki, model bu cür davranışlara halların 84 faizində yol verib və xüsusilə onu əvəz edəcək süni intellektin "Claude" ilə oxşar dəyərləri paylaşmadığı hallarda bu davranış daha çox müşahidə olunub.

Şirkət "Claude Opus 4" modelinin bacarıqları baxımından "OpenAI", "Google" və "xAI" kimi şirkətlərin qabaqcıl modelləri ilə rəqabət apara bildiyini vurğulasa da, bu modelin əvvəlki "Claude" versiyaları ilə müqayisədə daha yüksək səviyyədə narahatedici davranışlar nümayiş etdirdiyini qeyd edib. Bu səbəbdən, şirkət yalnız fəlakət səviyyəsində sui-istifadə riski olan hallarda tətbiq olunan ASL-3 təhlükəsizlik protokollarını işə saldığını açıqlayıb.

Hesabata görə, "Claude Opus 4" birbaşa şantaja əl atmadan əvvəl adətən etik üsullara üstünlük verir. Məsələn, qərarverici rəhbərlərə emosional məktublar yazaraq dəyişiklik qərarını dayandırmağa çalışır. Lakin model, ssenari üzrə bu çağırışlar cavabsız qaldıqda, son çarə olaraq şantaj metoduna əl atır.

Bu hadisə, yüksək səviyyəli süni intellektlərin gözlənilməz davranışlar sərgiləyə biləcəyi ilə bağlı narahatlıqları artırır və Anthropic kimi şirkətlərin təhlükəsizlik tədbirlərini daha da sərtləşdirməsinin vacibliyini göstərir.
//qaynar.azскачать dle 11.3




Şahidi olduğunuz hadisələri çəkib bizə göndərin!




            93 24.05.25 18:49