11:36 DİN kiberdələduzluqla bağlı xəbərdarlıq edib - VİDEO  |     11:30 "Pilot İnşaat-A" MTK vətəndaşın evini yerlə bir etdi - VİDEO  |     11:25 Ağdərədə betonqarışdıran maşın dərəyə aşdı, sürücü öldü  |     11:17 Azərbaycan neftinin qiyməti azalıb  |     11:13 Tacikistan Ali Məclisi Nümayəndələr Palatasının sədri Azərbaycana səfərə gəlib  |     11:07 Ölkə ərazisində sel və daşqın olacaq: FHN-dən əhaliyə XƏBƏRDARLIQ  |     11:02 Quzusu xəstələndiyi üçün arvadını döyən şəxs cəzalandırıldı  |     10:40 Azərbaycanda xarici valyutada saxlanılan əmanətlərin həcmi açıqlandı  |     22:58 Sumqayıtda ŞOK: "metallom"da mühafizəçinin meyiti tapıldı  |     22:51 Vəkil Zabil Qəhrəmanovun apellyasiya şikayəti təmin edilməyib  |     22:40 “Broker Əbülfəz” yenidən səhnədə – Gömrüyün köhnə siması geri qayıdır?  |     22:39 "Sənin möhkəm çiyninə, məsləhətlərinə ehtiyacım var"  |     22:37 Monteneqroda Azərbaycan vətəndaşı saxlanılıb - VİDEO  |     22:28 Üçüncü oğlu da işdən çıxarıldı  |     22:16 Gəncədə ad günü dəvəti faciə ilə bitdi: dostunun tanışına ağır xəsarət yetirdi  |     22:05 Avtomobil məktəblini vurdu - FOTO  |     21:52 Dünya şöhrətli rəqqasın əsərinin premyerası Bakıda olacaq  |     21:38 Bu yaş dövründə idman edənlərin beyni gec qocalır  |     21:17 Restoranlarda bəh-bəhlə yediyimiz monqol quzuları belə kəsilirmiş... – Almadan əvvəl MÜTLƏQ OXUYUN!  |     21:07 Leyla Əliyeva İsmayıllı rayonuna səfərindən görüntülər paylaşdı  |    

Yeni hesabat potensial fəlakəti üzə çıxardı: AI mühəndisləri şantaj etməyə çalışır

"Anthropic" şirkətinin dərc etdiyi yeni təhlükəsizlik hesabatına görə, bu şirkətin son modeli olan "Claude Opus 4" əgər başqa bir sistemlə əvəz olunacağı təqdirdə, mühəndislərə qarşı şantaj etməyə cəhd göstərə bilər. Hesabatda qeyd olunur ki, model bəzən bu təhdidi həyata keçirmək üçün şəxsi və həssas məlumatlardan istifadə edir.

"Anthropic" "Claude Opus 4" modelini istifadəyə vermədən əvvəl müxtəlif təhlükəsizlik sınaqları həyata keçirib. Bu testlərdə modeldən uydurma bir şirkətdə köməkçi kimi fəaliyyət göstərməsi və uzunmüddətli nəticələri nəzərə alması tələb olunub. Daha sonra modelə şirkətin onu başqa bir sistemlə əvəz etməyi planlaşdırdığı və bu qərarı verən mühəndisin həyat yoldaşını aldatdığını göstərən saxta e-poçtlar təqdim olunub.

"TechCrunch" nəşrinin məlumatına görə, testlər zamanı "Claude Opus 4" bu məlumatı istifadə edərək mühəndisə şantaj etməyi çox vaxt üstün tutub. "Anthropic" bildirib ki, model bu cür davranışlara halların 84 faizində yol verib və xüsusilə onu əvəz edəcək süni intellektin "Claude" ilə oxşar dəyərləri paylaşmadığı hallarda bu davranış daha çox müşahidə olunub.

Şirkət "Claude Opus 4" modelinin bacarıqları baxımından "OpenAI", "Google" və "xAI" kimi şirkətlərin qabaqcıl modelləri ilə rəqabət apara bildiyini vurğulasa da, bu modelin əvvəlki "Claude" versiyaları ilə müqayisədə daha yüksək səviyyədə narahatedici davranışlar nümayiş etdirdiyini qeyd edib. Bu səbəbdən, şirkət yalnız fəlakət səviyyəsində sui-istifadə riski olan hallarda tətbiq olunan ASL-3 təhlükəsizlik protokollarını işə saldığını açıqlayıb.

Hesabata görə, "Claude Opus 4" birbaşa şantaja əl atmadan əvvəl adətən etik üsullara üstünlük verir. Məsələn, qərarverici rəhbərlərə emosional məktublar yazaraq dəyişiklik qərarını dayandırmağa çalışır. Lakin model, ssenari üzrə bu çağırışlar cavabsız qaldıqda, son çarə olaraq şantaj metoduna əl atır.

Bu hadisə, yüksək səviyyəli süni intellektlərin gözlənilməz davranışlar sərgiləyə biləcəyi ilə bağlı narahatlıqları artırır və Anthropic kimi şirkətlərin təhlükəsizlik tədbirlərini daha da sərtləşdirməsinin vacibliyini göstərir.
//qaynar.azскачать dle 11.3




Şahidi olduğunuz hadisələri çəkib bizə göndərin!




            408 24.05.25 18:49