Technologijos

Kas yra DeepSeek ir ką gali kinų dirbtinis intelektas, dėl kurio OpenAI sumažino ChatGPT kainą?

Standartinis naujo neuroninio tinklo išleidimo scenarijus paprastai apima skambius pranešimus, plataus masto reklamos kampaniją ir vėlesnį naudotojų nusivylimą. Taip nutiko su „Apple Intelligence“, „Galaxy AI“ ir net „Google Gemini“. Tačiau Kinijos „DeepSeek“ sulaužė įprastą schemą. Šis pokalbių robotas visus nustebino ne tiek savo galimybėmis, kiek įspūdingu prieinamumu. Būtent jis parodė, kad efektyviai veikiantis neuroninis tinklas gali būti nemokamas. Dėl to Vakarų IT milžinai staiga susidūrė su rimtu konkurentu, kuris vien dėl savo išleidimo fakto jau sukėlė „juodąjį pirmadienį“ Amerikos akcijų rinkoje. Jei dar savarankiškai nenagrinėjote „DeepSeek“, pateikiame išsamią darbo su naujuoju produktu praktikos analizę.

Kas yra „DeepSeek“ ir kaip jis sukurtas?
DeepSeek yra neuroninis tinklas, kurį sukūrė to paties pavadinimo Kinijos bendrovė. Skirtingai nuo daugumos kitų rinkoje esančių sprendimų, jo privalumas yra tas, kad naudotojams jis prieinamas visiškai nemokamai, praktiškai neribojant užklausų skaičiaus ir temų. Neuroninis tinklas rašo tekstus, analizuoja dokumentus, programas ir atlieka daugelį kitų veiksmų, nereikalaudamas pirkti prenumeratos.

Pasak kūrėjų, tai tapo įmanoma dėl efektyvaus neuronų tinklo mokymo modelio, kuris pasirodė esąs gerokai pigesnis už konkurentų taikomą metodą. Skirtingai nei „ChatGPT“, „DeepSeek“ remiasi „ekspertų mišinio“ architektūra. Jos esmė – apdoroti duomenis atskirai, taikant tą ar kitą ekspertizę tik atitinkamoje srityje.

Šis metodas leido „DeepSeek“ apmokyti savo modelį vos per porą mėnesių naudojant palyginti kuklų NVIDIA H800 vaizdo plokščių klasterį. Palyginimui, kitoms bendrovėms tam prireikia daugybės mėnesių ir ištisų duomenų centrų. Dėl to bendrovei prireikė apie 5,6 mln. dolerių pokalbių robotui paleisti – tai bent 20 kartų mažiau, nei išleidžia konkurentai.

Žinoma, čia yra vienas niuansas, apie kurį daugelis žmonių mieliau nekalba. Niekas negali tvirtai teigti, kad už šios kuklios sumos neslypi kur kas rimtesnės Kinijos vyriausybės investicijos. Tačiau faktas lieka faktu, kad neuroninis tinklas veikia, ir veikia gana gerai.

Kaip naudoti „DeepSeek
DeepSeek galima naudoti ir naršyklėje, ir mobiliojoje programėlėje, skirtoje „iOS“ ir „Android“. Pokalbių roboto sąsaja labai panaši į „ChatGPT“ sąsają, todėl ją suprasite.

deepseek3


Svarbiausia užsiregistruoti, tačiau turėkite omenyje, kad dėl naudotojų antplūdžio gali kilti problemų. Iš esmės taip galite rašyti užklausas, tačiau tuomet istorija nebus išsaugota ir neuroninis tinklas negalės remtis ankstesnių skambučių kontekstu.

DeepSeek sąsaja iš tiesų labai paprasta. Joje nėra daug elementų:

Kairėje pusėje yra ankstesnių dialogų sąrašas ir mygtukas naujam pokalbiui sukurti, taip pat profilio piktograma;

centre yra užklausos įvedimo juosta;

Po ja yra mygtukas „DeepThink“, skirtas R1 modeliui įjungti, mygtukas „Search“, skirtas paieškos varikliui įjungti, ir segtukas, skirtas trečiųjų šalių failams pridėti.

„DeepSeek“ kalbos modeliai

deepseek2


Šiuo metu „DeepSeek“ siūlo du pagrindinius kalbos modelius: „DeepSeek-R1“ ir „DeepSeek-V3“. V3 yra sukurtas pagal „Mixture-of-Experts“ (MoE) architektūrą ir yra optimizuotas daugiaužduotims užduotims – nuo programavimo iki matematinių skaičiavimų ir daugiakalbio darbo. Apdorojant kiekvieną simbolį aktyvuojami tik 37B parametrai iš 671B, todėl modelis efektyviau naudoja išteklius.

Kita vertus, „DeepSeek R1“ specializuojasi loginio mąstymo ir sudėtingų problemų sprendimo srityje. Modelyje naudojama architektūra su optimizuotu pastiprinto mokymosi (Reinforcement Learning) sistema, kuri leidžia efektyviai spręsti užduotis, reikalaujančias gilios analizės ir samprotavimų. R1 turi mažesnį parametrų diapazoną – nuo 1,5B iki 70B, tačiau dėl savo specializacijos jis rodo įspūdingus rezultatus švietimo programose ir mokslinių tyrimų priemonėse.

Pagrindiniai „DeepSeek“ pranašumai prieš „ChatGPT“:

Kaina: 2,18 JAV dolerio R1, palyginti su 60 JAV dolerių už milijoną žetonų o1.

Atviras šaltinis ir galimybė paleisti vietoje

Prieiga prie naujausių duomenų per internetą

Efektyvus techninių ir mokslinių tekstų apdorojimas

Nuodugni dokumentacijos ir programos kodo analizė

Modelio galimybių palyginimas:

„DeepSeek-R1″: specializuojasi loginių išvadų daryme, analizėje ir programavime

DeepSeek-V3: efektyvus didelių duomenų apdorojimo ir daugiakalbių užduočių atlikimas

ChatGPT-4o: pirmauja natūralaus bendravimo ir daugialypės terpės gebėjimų srityje

Kaip „DeepSeek“ išleidimas paveikė rinką ir „ChatGPT
„DeepSeek“ išleidimas buvo svarbus įvykis dirbtinio intelekto technologijų rinkoje. Kinų neuroninis tinklas pasiūlė neįprastą požiūrį, remdamasis atviruoju kodu ir galimybe veikti vietoje. Dėl to įmonės ir kūrėjai gavo įrankį, leidžiantį diegti dirbtinį intelektą savo techninėje įrangoje ir visiškai kontroliuoti duomenų apdorojimą už mažesnę kainą nei „ChatGPT“.

DeepSeek modeliai turi įspūdingą skaičių parametrų ir yra apmokyti naudojant didžiulį duomenų rinkinį, kurio našumas prilygsta naujausių ChatGPT versijų našumui.

Nepaisant to, kinų pokalbių robotas turi trūkumų. Kartais sistema tam tikrais klausimais yra pernelyg atsargi. Ypač kalbant apie politiškai jautrias su Kinija susijusias temas. Pavyzdžiui, aptariant tokius klausimus, kaip įvykiai Tiananmenio aikštėje, Taivano nepriklausomybė ar uigūrų padėtis, „DeepSeek“ arba vengia atsakyti, arba pateikia informaciją, atitinkančią oficialią Kinijos vyriausybės poziciją.

Tačiau yra ir techninių trūkumų. DeepSeek ne visada teisingai tvarko nuorodas ir gali pateikti netikslumų, jei nesinaudojama interneto prieiga. Tačiau paprastai naudojant šią priemonę šis trūkumas išlyginamas.

Taip, „ChatGPT“ fone kinų neuroninis tinklas atrodo šiek tiek mažiau universalus ir išbandytas sprendimas. Tačiau jį galima drąsiai naudoti techninėms užduotims, pavyzdžiui, dokumentų analizei, programavimui, interneto paieškai ir struktūrizuotų duomenų apdorojimui.

Tuo pat metu pats faktas, kad „DeepSeek“ jau rimtai sukrėtė dirbtinio intelekto rinką. OpenAI teko sumažinti „ChatGPT Plus“ prenumeratos kainą iki 10 JAV dolerių pirmiesiems trims mėnesiams – perpus mažiau nei standartinė kaina. O Italijos reguliavimo institucija, kažko baimindamasi, pareikalavo pašalinti programą iš „App Store“ ir „Google Play“ neva dėl įtarimų, kad ji perduoda naudotojų duomenis į Kiniją.

Ir nors „DeepSeek“ dar negali visiškai pakeisti „ChatGPT“, „Grok“ ar „Claude“, dėl konkurencijos pažangios dirbtinio intelekto technologijos jau tampa prieinamesnės paprastiems naudotojams. Taigi bent jau jūs ir aš nepralaimime.

5/5 - 1 balsas(-ai)

Taip pat skaitykite

Prenumeruoti
Pranešti apie
guest
0 Komentarai
Seniausi
Naujausi Daugiausiai balsavo
Įterpti atsiliepimai
Žiūrėti visus komentarus
Back to top button