Mojo.az Banner
23:01 Məşhur aktyor dünyasını dəyişdi  |     22:48 Zaqatalada iki minik avtomobili toqquşub, xəsarət alanlar var  |     22:43 Ağacın arxasında qalan nişan sürücülərin qayda pozmasına səbəb olur - Video  |     22:35 Günel Mövludun Bakıya gələn həyat yoldaşı həbs edildi  |     22:29 Qış təkərləri yayda niyə təhlükəlidir? – ARAŞDIRMA  |     22:22 Araz Ağalarovun 27 yaşlı xanımı ilk dəfə danışdı - “Yoldaşım yun yorğana üstünlük verir”  |     22:17 Rusiyalı şahmatçı bir il müddətinə diskvalifikasiya edildi  |     22:10 “Qarabağ”ın oyununa bilet satışı dayandırıldı - Səbəb  |     22:04 Mundialın uğursuzunda dopinq şoku: Cəza veriləcək?  |     21:56 Müdafiə Nazirliyi məlumat yaydı  |     21:51 Ərdoğan Meloni ilə müzakirə apardı  |     21:44 Məcburi köçkünün mənzil iddiasına qurumdan RƏSMİ CAVAB  |     21:39 Xarkovda faciəli şəkildə ölən Fatimənin yaxınlarından ürəkdağlayan sözlər (VİDEO)  |     21:31 Dövlət qulluqçusu olmaq istəyənlərin NƏZƏRİNƏ  |     21:26 Bu ərazidə qaz olmayacaq  |     21:01 Azərbaycanda dövlət portalı vasitəsilə 42 milyon manatlıq cinayət: 11 nəfər məhkəmə qarşısında  |     21:00 Ermənistan vətəndaşlarının şikayətləri üzrə apellyasiya məhkəməsində təqsirləndirilən şəxslərin vəsatətlərinə baxılıb  |     20:49 İnterpol xətti ilə axtarışa verilən şəxs Monteneqrodan Azərbaycana ekstradisiya olunur  |     20:36 "Dedi Qodu" kafesinin sahibinin burnunu sındırdı - Məhkəmə zalında həbs edildi  |     20:31 Zorakılığa məruz qalanların sayı açıqlandı  |    
Left Banner
Right Banner

"DeepSeek" süni intellekt sahəsində daha bir inqilabi yenilik elan etdi

08.04.2025 13:02 1 191
Çinin "R1" modeli ilə tanınan "DeepSeek" startapı süni intellektin effektivliyini əhəmiyyətli dərəcədə artıracaq yeni təlim metodunu elan edib.

Median.Az
-ın "South China Morning Post"a istinadən verdiyi məlumata görə, "DeepSeek" komandası Sinhua Universitetinin tədqiqatçıları ilə birlikdə innovativ yanaşmanın təfərrüatını açıqlayan elmi məqalə dərc ediblər.

İşlənib hazırlanmış metod süni intellekt modellərinin insan seçimlərinə uyğunluğunu yaxşılaşdırmağa yönəlib. O, daha dəqiq və anlaşılan cavabların yaradılmasını stimullaşdıran mükafatlandırma mexanizmindən istifadə edir. Möhkəmləndirici təlim artıq ixtisaslaşmış tapşırıqlarda faydasını sübut edib, lakin daha ümumi tapşırıqlara tətbiq edildikdə onun effektivliyi azalırdı.

"DeepSeek" komandası generativ mükafatlandırma modelləşdirməsini prinsiplərə əsaslanan özünütənqidi tənzimləmə ilə birləşdirən həll təklif edib.

Tədqiqata görə, yeni yanaşma böyük dil modellərinin (LLM) mühakimə qabiliyyətlərini yaxşılaşdırmaq üçün mövcud metodları üstələyir. Testlər göstərib ki, GRM istifadə edərək təlim keçmiş modellər ümumi sorğuların emalında maksimum məhsuldarlıq nümayiş etdirir və eyni zamanda daha az hesablama resursları tələb edir.

Yeni modellər "DeepSeek-GRM" adlandırılıb, bu ad "Generalist Reward Modeling" (universal mükafatlandırma modelləşdirməsi) abbreviaturasından götürülüb. Şirkət modelləri açıq mənbəli etmək planlarını elan edib, lakin dəqiq buraxılış tarixləri hələ açıqlanmayıb.скачать dle 11.3
Mojo.az Banner