Mojo.az Banner
23:00 Epşteynin sağ olduğu iddia edildi  |     22:56 Bakıda iki körpə eyni vaxtda həyatını itirdi: Əkizlərin ölümündə müəmmalı "boya" detalı (Video)  |     22:45 Abituriyentlər niyə daha çox paytaxt universitetlərinə üstünlük verirlər? - Video  |     22:33 "Card to card" dövrü bitir? - Hər kəsin bilməli olduğu YENİLİK  |     22:12 Ermənistanda hərbi qulluqçunun meyiti aşkarlanıb  |     22:08 200 illik tarixi məscid qəzalı vəziyyətdə: İbadət edənlər Zaqatalaya gedirlər (Video)  |     22:01 Azərbaycana səfəri zamanı ABŞ vitse-prezidentini dövlət katibinin müavini müşayiət edəcək  |     21:50 AZTV-nin sədr müavininə ağır itki  |     21:40 Pakistanda məsciddə törədilmiş terror aktının təşkilatçısı saxlanıldı  |     21:29 Alış-veriş edən 73 yaşlı kişinin ürəyi dayandı - Azərbaycanda  |     21:17 "Qızıl qaya" istirahət mərkəzində yanğın oldu  |     21:06 Ceyhun Bayramov sabiq səfirə yüksək vəzifə verdi (FOTO)  |     20:51 On min manatlıq cehizlik oğurlayan şəxs saxlanıldı  |     20:37 Bir ailənin dörd üzvü dəm qazından zəhərləndi - Sumqayıtda  |     20:36 "Crocus City Hall"dakı terror aktı üzrə məhkəmədə gizli şahidin ifadəsi dinlənildi  |     20:08 Uşaqlar dərsə gəlmir deyən müəllimlə bağlı tədbir görüldü - VİDEO  |     19:59 Ermənistan XİN-də Azərbaycan və Türkiyə ilə münasibətlər müzakirə edilib  |     19:51 Güllələnən müəllimin atası: "Sosial şəbəkədə nə gəldi yazırlar" (VİDEO)  |     19:31 Azərbaycan cüdoçusu finala vəsiqə qazandı  |     19:25 Sabahın havası meteohəssas insanlar üçün necə olacaq?  |    
Left Banner
Right Banner

"DeepSeek" süni intellekt sahəsində daha bir inqilabi yenilik elan etdi

08.04.2025 13:02 894
Çinin "R1" modeli ilə tanınan "DeepSeek" startapı süni intellektin effektivliyini əhəmiyyətli dərəcədə artıracaq yeni təlim metodunu elan edib.

Median.Az
-ın "South China Morning Post"a istinadən verdiyi məlumata görə, "DeepSeek" komandası Sinhua Universitetinin tədqiqatçıları ilə birlikdə innovativ yanaşmanın təfərrüatını açıqlayan elmi məqalə dərc ediblər.

İşlənib hazırlanmış metod süni intellekt modellərinin insan seçimlərinə uyğunluğunu yaxşılaşdırmağa yönəlib. O, daha dəqiq və anlaşılan cavabların yaradılmasını stimullaşdıran mükafatlandırma mexanizmindən istifadə edir. Möhkəmləndirici təlim artıq ixtisaslaşmış tapşırıqlarda faydasını sübut edib, lakin daha ümumi tapşırıqlara tətbiq edildikdə onun effektivliyi azalırdı.

"DeepSeek" komandası generativ mükafatlandırma modelləşdirməsini prinsiplərə əsaslanan özünütənqidi tənzimləmə ilə birləşdirən həll təklif edib.

Tədqiqata görə, yeni yanaşma böyük dil modellərinin (LLM) mühakimə qabiliyyətlərini yaxşılaşdırmaq üçün mövcud metodları üstələyir. Testlər göstərib ki, GRM istifadə edərək təlim keçmiş modellər ümumi sorğuların emalında maksimum məhsuldarlıq nümayiş etdirir və eyni zamanda daha az hesablama resursları tələb edir.

Yeni modellər "DeepSeek-GRM" adlandırılıb, bu ad "Generalist Reward Modeling" (universal mükafatlandırma modelləşdirməsi) abbreviaturasından götürülüb. Şirkət modelləri açıq mənbəli etmək planlarını elan edib, lakin dəqiq buraxılış tarixləri hələ açıqlanmayıb.скачать dle 11.3