Mojo.az Banner
23:04 Almaniya hökuməti yüzlərlə əfqanın ölkəyə qəbulundan imtina etdi  |     22:59 "Google Maps"a sürücülər üçün faydalı funksiya əlavə olundu  |     22:51 Bu sual məktəblilərə verilib? - Rəsmi açıqlama  |     22:46 5 avtobus marşrutu üzrə müsabiqələrin qalibləri müəyyənləşdi  |     22:41 "Bu halda karta vəsaitin daxil olması qeyri-formal məşğulluq kimi qiymətləndirə bilər" - Ekspert  |     22:34 "Baku Mall"da maşınını şarja taxdı - Qiyməti görüb şoka düşdü (FOTO)  |     22:29 Bakı–Bratislava birbaşa uçuşlarına start verilir  |     22:22 Azərbaycana casusluq etdiyi deyilən erməni diplomatla bağlı qərar verildi  |     22:17 Biləcərini su basdı - Video  |     22:11 Məşhur opera müğənnisi oğlu tərəfindən öldürüldü  |     22:03 Dövlət sektoru üzrə istehsalat qəzaları ilə bağlı sığorta ödənişini DSMF yerinə yetirəcək  |     21:58 “Qarabağ” hesabı açdı  |     21:52 “Qarabağ” - “Ayaks” oyunu başladı - CANLI  |     21:51 "Xiaomi" gəlirsizlik səbəbindən 1000-dən çox mağazanı bağlayacaq  |     21:42 İslandiya "Eurovision-2026"da iştirak etməyəcək  |     21:40 İsveçrədə yeni prezident seçildi  |     21:11 Prezidentin rektor təyin etdiyi Rövşən İsmayılov kimdir?  |     21:08 Bakıda hər 44 nəfərə bir mağaza düşür - Son 5 ildə 2,3 dəfə artıb  |     20:53 Azərbaycanda özəl data mərkəzi yaradılacaq  |     20:50 Bakıda Azərbaycan-Rusiya siyasi məsləhətləşmələri keçirildi  |    
Left Banner
Right Banner

"DeepSeek" süni intellekt sahəsində daha bir inqilabi yenilik elan etdi

08.04.2025 13:02 810
Çinin "R1" modeli ilə tanınan "DeepSeek" startapı süni intellektin effektivliyini əhəmiyyətli dərəcədə artıracaq yeni təlim metodunu elan edib.

Median.Az
-ın "South China Morning Post"a istinadən verdiyi məlumata görə, "DeepSeek" komandası Sinhua Universitetinin tədqiqatçıları ilə birlikdə innovativ yanaşmanın təfərrüatını açıqlayan elmi məqalə dərc ediblər.

İşlənib hazırlanmış metod süni intellekt modellərinin insan seçimlərinə uyğunluğunu yaxşılaşdırmağa yönəlib. O, daha dəqiq və anlaşılan cavabların yaradılmasını stimullaşdıran mükafatlandırma mexanizmindən istifadə edir. Möhkəmləndirici təlim artıq ixtisaslaşmış tapşırıqlarda faydasını sübut edib, lakin daha ümumi tapşırıqlara tətbiq edildikdə onun effektivliyi azalırdı.

"DeepSeek" komandası generativ mükafatlandırma modelləşdirməsini prinsiplərə əsaslanan özünütənqidi tənzimləmə ilə birləşdirən həll təklif edib.

Tədqiqata görə, yeni yanaşma böyük dil modellərinin (LLM) mühakimə qabiliyyətlərini yaxşılaşdırmaq üçün mövcud metodları üstələyir. Testlər göstərib ki, GRM istifadə edərək təlim keçmiş modellər ümumi sorğuların emalında maksimum məhsuldarlıq nümayiş etdirir və eyni zamanda daha az hesablama resursları tələb edir.

Yeni modellər "DeepSeek-GRM" adlandırılıb, bu ad "Generalist Reward Modeling" (universal mükafatlandırma modelləşdirməsi) abbreviaturasından götürülüb. Şirkət modelləri açıq mənbəli etmək planlarını elan edib, lakin dəqiq buraxılış tarixləri hələ açıqlanmayıb.скачать dle 11.3