23:01 Ukraynadakı müharibə zəka və hiyləgərlik yarışına çevrilib - CNN  |     22:56 Aİ nadir torpaq metallarının tədarükündə Çindən asılılığını azaldacaq  |     22:50 “Zirə”dən qələbə, “Araz Naxçıvan” - “Sabah” matçında isə heç-heçə  |     22:41 Sumqayıtda mənzildə meyit tapıldı  |     22:36 Qriqori Leps xəstəxanaya yerləşdirildi - Vəziyyəti ağırdır  |     22:29 “Cərimənizi hələ ödəməmişəm, indi nə üçün gəlmisiniz?!” - AQTA və qəssablar arasında qalmaqal (Video)  |     22:20 Yeni “iPhone” dizaynları təqdim ediləcək  |     22:15 “İnter” argentinalı futbolçu ilə danışıqlar aparır  |     22:08 Bu yanacaqdoldurma məntəqəsi bağlandı - Video  |     22:00 Narkokartellər Avropaya kokain keçirmək üçün yeni üsullara əl atıb  |     21:54 Bakıda daş hasar hər an uçma təhlükəsi ilə üz-üzədir - Video  |     21:49 28 yaşlı kişi kəsici alətdən xəsarət aldı  |     21:47 Həmin qalmaqallı qurultaydan daha bir görüntü - Video  |     21:26 Gəncədə saxlanılan keçmiş vəkilin məhkəməsi keçirilir  |     21:13 Rusiyada həbsdə olan azərbaycanlı iş adamı sərbəst buraxıldı  |     21:06 Beyləqanda 43 yaşlı kişini elektrik cərəyanı vurub  |     21:01 Çobanyastığı çayının 5 yan təsiri - Diyetoloqlar açıqladı  |     20:54 Kirayə mənzil qiymətləri artacaq  |     20:47 Torpaq bazarında qiymətlər necədir?  |     20:44 Donald Tramp Kim Çen Inla görüşməyə hazırdır  |    

"DeepSeek" süni intellekt sahəsində daha bir inqilabi yenilik elan etdi

Çinin "R1" modeli ilə tanınan "DeepSeek" startapı süni intellektin effektivliyini əhəmiyyətli dərəcədə artıracaq yeni təlim metodunu elan edib.

Median.Az
-ın "South China Morning Post"a istinadən verdiyi məlumata görə, "DeepSeek" komandası Sinhua Universitetinin tədqiqatçıları ilə birlikdə innovativ yanaşmanın təfərrüatını açıqlayan elmi məqalə dərc ediblər.

İşlənib hazırlanmış metod süni intellekt modellərinin insan seçimlərinə uyğunluğunu yaxşılaşdırmağa yönəlib. O, daha dəqiq və anlaşılan cavabların yaradılmasını stimullaşdıran mükafatlandırma mexanizmindən istifadə edir. Möhkəmləndirici təlim artıq ixtisaslaşmış tapşırıqlarda faydasını sübut edib, lakin daha ümumi tapşırıqlara tətbiq edildikdə onun effektivliyi azalırdı.

"DeepSeek" komandası generativ mükafatlandırma modelləşdirməsini prinsiplərə əsaslanan özünütənqidi tənzimləmə ilə birləşdirən həll təklif edib.

Tədqiqata görə, yeni yanaşma böyük dil modellərinin (LLM) mühakimə qabiliyyətlərini yaxşılaşdırmaq üçün mövcud metodları üstələyir. Testlər göstərib ki, GRM istifadə edərək təlim keçmiş modellər ümumi sorğuların emalında maksimum məhsuldarlıq nümayiş etdirir və eyni zamanda daha az hesablama resursları tələb edir.

Yeni modellər "DeepSeek-GRM" adlandırılıb, bu ad "Generalist Reward Modeling" (universal mükafatlandırma modelləşdirməsi) abbreviaturasından götürülüb. Şirkət modelləri açıq mənbəli etmək planlarını elan edib, lakin dəqiq buraxılış tarixləri hələ açıqlanmayıb.скачать dle 11.3




Şahidi olduğunuz hadisələri çəkib bizə göndərin!




            735 08.04.25 13:02