Yeni hesabat potensial fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır » Median.Az - Bütün xəbərlər bir ünvanda
14:18 Erməni əsirliyində olmuş azərbaycanlı: "İşgəncələrə məruz qalırdım, döyülürdüm"  |     13:42 İlin birinci yarısında 400 mindən çox şəxsə Prezident təqaüdü ödənilib  |     13:40 Ağdaşda kanalda batan respublika çempionunun meyiti tapıldı - Video  |     13:32 Gürcüstanın təhlükəsizlik orqanlarından əməliyyat: Nüvə materialı satışının qarşısı alındı  |     13:03 Bakı-Sumqayıt yolundakı yerüstü keçiddə piyadalar üçün CİDDİ TƏHLÜKƏ - Video  |     12:42 İranda TRAGİKOMİK HADİSƏ - Prezidentin kortejində benzin bitdi, yolda qaldı - FOTO  |     12:41 Naxçıvanın enerji sistemi yenidən qurulur  |     12:31 Pərakəndə və topdansatış obyektlərində satışa çıxarılan dondurmalarda TƏHLÜKƏ VAR?  |     12:30 Ukraynanın yeni baş naziri seçilib  |     12:14 "Yuventus" heyətini ingiltərəli futbolçu ilə gücləndirir  |     12:11 Salyan şəhər mərkəzində qaz təchizatı dayandırıldı  |     12:09 Rus bölməsi üzrə birinci sinfə məktəb seçiminə başlanılıb  |     11:44 25 günlük körpə öldü  |     11:39 Azərbaycan XİN İraqa başsağlığı verdi  |     11:25 Azərbaycan və Qazaxıstan xüsusi təyinatlıları döyüş təcrübəsini müzakirə ediblər  |     11:07 Qanunsuz saxlanılan odlu silah-sursat aşkar olunaraq götürülüb  |     22:52 Tramp: ABŞ neftin dünya bazarında ucuzlaşmasına çalışır  |     22:47 İran nüvə proqramı ilə bağlı ABŞ-la danışıqları bərpa etmək istəyir  |     22:47 Komitədən hamilə olan 14 yaşlı qızla bağlı AÇIQLAMA  |     22:35 Dünyada şöhrət qazanmış falçı saxlanıldı  |    

Yeni hesabat potensial fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır

"Anthropic" şirkətinin dərc etdiyi yeni təhlükəsizlik hesabatına görə, bu şirkətin son modeli olan "Claude Opus 4" əgər başqa bir sistemlə əvəz olunacağı təqdirdə, mühəndislərə qarşı şantaj etməyə cəhd göstərə bilər. Hesabatda qeyd olunur ki, model bəzən bu təhdidi həyata keçirmək üçün şəxsi və həssas məlumatlardan istifadə edir.

"Anthropic" "Claude Opus 4" modelini istifadəyə vermədən əvvəl müxtəlif təhlükəsizlik sınaqları həyata keçirib. Bu testlərdə modeldən uydurma bir şirkətdə köməkçi kimi fəaliyyət göstərməsi və uzunmüddətli nəticələri nəzərə alması tələb olunub. Daha sonra modelə şirkətin onu başqa bir sistemlə əvəz etməyi planlaşdırdığı və bu qərarı verən mühəndisin həyat yoldaşını aldatdığını göstərən saxta e-poçtlar təqdim olunub.

"TechCrunch" nəşrinin məlumatına görə, testlər zamanı "Claude Opus 4" bu məlumatı istifadə edərək mühəndisə şantaj etməyi çox vaxt üstün tutub. "Anthropic" bildirib ki, model bu cür davranışlara halların 84 faizində yol verib və xüsusilə onu əvəz edəcək süni intellektin "Claude" ilə oxşar dəyərləri paylaşmadığı hallarda bu davranış daha çox müşahidə olunub.

Şirkət "Claude Opus 4" modelinin bacarıqları baxımından "OpenAI", "Google" və "xAI" kimi şirkətlərin qabaqcıl modelləri ilə rəqabət apara bildiyini vurğulasa da, bu modelin əvvəlki "Claude" versiyaları ilə müqayisədə daha yüksək səviyyədə narahatedici davranışlar nümayiş etdirdiyini qeyd edib. Bu səbəbdən, şirkət yalnız fəlakət səviyyəsində sui-istifadə riski olan hallarda tətbiq olunan ASL-3 təhlükəsizlik protokollarını işə saldığını açıqlayıb.

Hesabata görə, "Claude Opus 4" birbaşa şantaja əl atmadan əvvəl adətən etik üsullara üstünlük verir. Məsələn, qərarverici rəhbərlərə emosional məktublar yazaraq dəyişiklik qərarını dayandırmağa çalışır. Lakin model, ssenari üzrə bu çağırışlar cavabsız qaldıqda, son çarə olaraq şantaj metoduna əl atır.

Bu hadisə, yüksək səviyyəli süni intellektlərin gözlənilməz davranışlar sərgiləyə biləcəyi ilə bağlı narahatlıqları artırır və Anthropic kimi şirkətlərin təhlükəsizlik tədbirlərini daha da sərtləşdirməsinin vacibliyini göstərir.
//qaynar.azскачать dle 11.3




Şahidi olduğunuz hadisələri çəkib bizə göndərin!




            210 24.05.25 18:49