Mojo.az Banner
23:07 Gəncədə yeniyetməni avtomobil vurdu  |     22:56 MTK-lar daxili krediti niyə azaldıblar? (VİDEO)  |     22:51 İbrahimoviç Zəfər parkını və Şəhidlər xiyabanını ziyarət edib  |     22:28 “Fənərbağça”nın prezidenti sərbəst buraxıldı  |     22:19 Astarada mobil telefonunda qumar oynayan şəxs cərimə edildi  |     22:11 "Mersedes" Dubayda 8 milyardlıq şəhər inşa edir  |     22:01 Polad Bülbüloğlu oğlu ilə Şuşadakı evinin bağını göstərdi - VİDEO  |     21:47 Bacısı oğlu və azyaşlı uşağının başına silah dayayıb girov götürdü  |     21:42 Bu il neçə kişi sığınacağa müraciət edib?  |     21:34 Çin raket vasitəsilə orbitə eksperimental rabitə peyki çıxarıb  |     21:26 Leyla Əliyeva Nüsrət Kəsəmənlinin şeirini səsləndirdi - VİDEO  |     21:17 Keçmiş prokuror vəfat etdi  |     20:57 Rusiya ordusu bu kəndləri ələ keçirdi  |     20:49 Murad Övüç həbs edildi  |     20:28 Avropa ölkələri Ukrayna üçün hər il bu qədər pul ödəyəcək  |     20:22 Amnistiyanın icrasına başlanılıb  |     20:18 MDB liderləri Sankt-Peterburqa toplaşır - Tarix açıqlandı  |     19:58 Bu şəhərdə sadəcə 18 dəqiqə gündüz olacaq  |     19:45 Bu şəxslərə bayramla əlaqədar 500 manat verildi - RƏSMİ  |     19:23 İranda İsraillə əlaqədə ittiham olunan gənc edam olunacaq  |    
Left Banner
Right Banner

"DeepSeek" süni intellekt sahəsində daha bir inqilabi yenilik elan etdi

08.04.2025 13:02 822
Çinin "R1" modeli ilə tanınan "DeepSeek" startapı süni intellektin effektivliyini əhəmiyyətli dərəcədə artıracaq yeni təlim metodunu elan edib.

Median.Az
-ın "South China Morning Post"a istinadən verdiyi məlumata görə, "DeepSeek" komandası Sinhua Universitetinin tədqiqatçıları ilə birlikdə innovativ yanaşmanın təfərrüatını açıqlayan elmi məqalə dərc ediblər.

İşlənib hazırlanmış metod süni intellekt modellərinin insan seçimlərinə uyğunluğunu yaxşılaşdırmağa yönəlib. O, daha dəqiq və anlaşılan cavabların yaradılmasını stimullaşdıran mükafatlandırma mexanizmindən istifadə edir. Möhkəmləndirici təlim artıq ixtisaslaşmış tapşırıqlarda faydasını sübut edib, lakin daha ümumi tapşırıqlara tətbiq edildikdə onun effektivliyi azalırdı.

"DeepSeek" komandası generativ mükafatlandırma modelləşdirməsini prinsiplərə əsaslanan özünütənqidi tənzimləmə ilə birləşdirən həll təklif edib.

Tədqiqata görə, yeni yanaşma böyük dil modellərinin (LLM) mühakimə qabiliyyətlərini yaxşılaşdırmaq üçün mövcud metodları üstələyir. Testlər göstərib ki, GRM istifadə edərək təlim keçmiş modellər ümumi sorğuların emalında maksimum məhsuldarlıq nümayiş etdirir və eyni zamanda daha az hesablama resursları tələb edir.

Yeni modellər "DeepSeek-GRM" adlandırılıb, bu ad "Generalist Reward Modeling" (universal mükafatlandırma modelləşdirməsi) abbreviaturasından götürülüb. Şirkət modelləri açıq mənbəli etmək planlarını elan edib, lakin dəqiq buraxılış tarixləri hələ açıqlanmayıb.скачать dle 11.3