Mojo.az Banner
22:23 İmişlidə müəllim əməkhaqqına görə direktorla dalaşdı, arvadını və qızını DÖYDÜ - TƏFƏRRÜAT  |     22:17 Dünyanın ən yüksək paytaxtı: Nəfəs almaq çox çətindir  |     22:06 Sabah qaz kəsiləcək - Bu ərazilərdə  |     22:00 31 yaşlı Nigar Adilova prorektor TƏYİN EDİLDİ  |     21:45 Gəncədə kuryer qəzaya düşdü  |     21:37 İnanılmaz şanslı olacaq bürclər  |     21:25 Rusiya bu ölkələri hədələdi  |     21:13 Onlara yeni vəzifə verildi  |     21:03 Keçmiş futbolçu qəzada öldü  |     20:47 Kondisioner ustasının ölümü ilə nəticələnən faciə niyə baş verdi? - Video  |     20:31 Azərbaycan millisinin rəqibləri müəyyənləşdi  |     20:24 Rəsmi Moskvadan bu ölkələrə xəbərdarlıq  |     20:18 Müştəri kimi aptekə daxil olub oğurluq edən şəxs saxlanıldı  |     20:14 Azərbaycanda dörd nəfərə yüksək VƏZİFƏ VERİLDİ - ADLAR (FOTO)  |     20:01 445 min manat mənimsəmədə şübhəli bilinən qadın Türkiyədən Azərbaycana ekstradisiya olunacaq  |     19:54 Sürücülərin NƏZƏRİNƏ: Paytaxtın bir sıra yollarında təmir işləri aparılacaq  |     19:34 Bakıda 5 avtomobildən oğurluq edildi  |     19:28 TƏCİLİ: Azərbaycanda içində çox sayda şagird olan avtobus AŞDI - Hadisə yerindən GÖRÜNTÜLƏR - (FOTO / VİDEO)  |     19:15 Alkoqolsuz içkilərin emalı sexində YOXLAMA: İstehsal dayandırıldı  |     18:38 Ailə başçısını itirən tələbələrlə bağlı VACİB QƏRAR  |    
Left Banner
Right Banner

"DeepSeek" süni intellekt sahəsində daha bir inqilabi yenilik elan etdi

08.04.2025 13:02 1 053
Çinin "R1" modeli ilə tanınan "DeepSeek" startapı süni intellektin effektivliyini əhəmiyyətli dərəcədə artıracaq yeni təlim metodunu elan edib.

Median.Az
-ın "South China Morning Post"a istinadən verdiyi məlumata görə, "DeepSeek" komandası Sinhua Universitetinin tədqiqatçıları ilə birlikdə innovativ yanaşmanın təfərrüatını açıqlayan elmi məqalə dərc ediblər.

İşlənib hazırlanmış metod süni intellekt modellərinin insan seçimlərinə uyğunluğunu yaxşılaşdırmağa yönəlib. O, daha dəqiq və anlaşılan cavabların yaradılmasını stimullaşdıran mükafatlandırma mexanizmindən istifadə edir. Möhkəmləndirici təlim artıq ixtisaslaşmış tapşırıqlarda faydasını sübut edib, lakin daha ümumi tapşırıqlara tətbiq edildikdə onun effektivliyi azalırdı.

"DeepSeek" komandası generativ mükafatlandırma modelləşdirməsini prinsiplərə əsaslanan özünütənqidi tənzimləmə ilə birləşdirən həll təklif edib.

Tədqiqata görə, yeni yanaşma böyük dil modellərinin (LLM) mühakimə qabiliyyətlərini yaxşılaşdırmaq üçün mövcud metodları üstələyir. Testlər göstərib ki, GRM istifadə edərək təlim keçmiş modellər ümumi sorğuların emalında maksimum məhsuldarlıq nümayiş etdirir və eyni zamanda daha az hesablama resursları tələb edir.

Yeni modellər "DeepSeek-GRM" adlandırılıb, bu ad "Generalist Reward Modeling" (universal mükafatlandırma modelləşdirməsi) abbreviaturasından götürülüb. Şirkət modelləri açıq mənbəli etmək planlarını elan edib, lakin dəqiq buraxılış tarixləri hələ açıqlanmayıb.скачать dle 11.3
Mojo.az Banner