„ChatGPT“ žudikas? Kilo tikra panika. Kodėl visi staiga išsigando Kinijos „DeepSeek“?  ()

Kinijos startuolio „DeepSeek“ dirbtinio intelekto modelis audringai įsiveržė į DI rinką. Staiga Vakarų technologijų įmonės pajuto konkurencijos kvapą. Kokia yra „Deep Seek“ paslaptis?



© Ekrano kopija | https://x.com/Div_pradeep/status/1884540347302531344/photo/1

Prisijunk prie technologijos.lt komandos!

Laisvas grafikas, uždarbis, daug įdomių veiklų. Patirtis nebūtina, reikia tik entuziazmo.

Sudomino? Užpildyk šią anketą!

Kinijos DI užkariauja pasaulį. „DeepSeek“ fenomenas

„Panika „Meta“ būstinėje“, „Kinai sunaikino ChatGPT“, „Vakarų technologijų milžinams šokas“. Tokio tipo antraštės pasirodė žiniasklaidoje po atvirojo kodo DI modelio „DeepSeek R1“ išplitimo. Modelis, kuris turi pasiekti palyginamus ar net geresnius rezultatus nei „OpenAI“ modeliai. Ir nenuostabu, kad tai sukėlė didžiulę Silicio slėnio technologijų magnatų paniką.

Kaip pranešė „Bloomberg“, „Microsoft“ ir „OpenAI“ jau tiria „DeepSeek“ dėl galimos vagystės. Įmonės mano, kad kinai savo modelį sukūrė remdamiesi Amerikos duomenimis. Teigiama, kad prieš kelis mėnesius „Microsoft“ ir „OpenAI“ užblokavo kai kuriuos Kinijos IP dėl padidėjusio jų aktyvumo.

Tačiau rinka jau sureagavo į Kinijos DI populiarumą, o akcijų rinka patyrė didelį nuosmukį – smigo „Tesla“, „Microsoft“, „Google“ ir NVIDIA akcijų vertė.

Marcas Andreessenas, vienas iš pirmosios plačiai naudojamos naršyklės „Mosaic“ kūrėjų, „DeepSeek R1“ paleidimą DI plėtros lenktynėse palygino su sovietų palydovo „Sputnik“ paleidimu (1957 metais) kosminėse lenktynėse.

Kas yra „DeepSeek“ ir kodėl visi staiga jo išsigando?

[EU+Kuponas] Įspūdinga kaina ir galimybės. Maisto džiovinimo mašina – jūsų sveikas pasirinkimas. Džiaugiasi milijonai („VEVOR SS-06A“)
2386 4

Labai gera kaina

Specialus kuponas

Iš Vokietijos greitas ir saugus pristatymas

Aukščiausia kokybė

Labai ribotas kiekis

Išsamiau

„DeepSeek“ yra startuolis, įkurtas 2023 m. sausį, vadovaujamas inžinieriaus Liang Wenfeng. Startuolis priklauso ir jį remia ankstesnė jo įmonė „High-Flyer“, kuri 2016 m. pradėjo tyrinėti dirbtinio intelekto ir mašininio mokymosi galimybes, 2020 m. sukurdama savo superkompiuterį šiam tikslui. Liang Wenfeng 2021 m. pradėjo pirkti tūkstančius NVDIA grafikos procesorių (GPU), kad išlaikytų reikiamą skaičiavimo galią tyrimams. Tai buvo prieš JAV įvedant puslaidininkių pardavimo Kinijai sankcijas.

„DeepSeek“ startuolio tikslas buvo sukurti dar geresnius bendrojo dirbtinio intelekto (AGI, artificial general intelligence) modelius. Kinai savo modelio pagrindui naudojo turimą „Meta“ kalbos modelį „Llama“. Tiksliai nežinoma, kokio dydžio buvo pirmųjų „DeepSeek“ modelių kopija, tačiau mokymosi duomenys taip pat apėmė dirbtinai sugeneruotą informaciją.

 

Mokant ir tobulinant „DeepSeek“ modelį, stebina labai geras jo optimizavimas. Buvęs „OpenAI“ darbuotojas Milesas Brundage'as teigė, kad kinai rado būdą, kaip geriau panaudoti pigesnių grafikos plokščių galią dirbtinio intelekto modeliui treniruoti bandymų ir klaidų sprendimais, o ne kopijuojant iš žmonių perduotus sprendimus.

 

„DeepSeek“ modeliai de facto sukurti taip, kad ne visada aktyvuotų visą modelio galią, nebent to reikia. Manoma, kad Kinijos sprendimas yra efektyvesnis nei JAV analogai. „DeepSeek“ komanda taip pat sukūrė tai, kas vadinama „DeepSeekMLA“ (angl. Multi-Head Latent Attention), kuri labai sumažino dirbtinio intelekto modeliams paleisti būtinos atminties poreikį, suglaudindama modelio informacijos saugojimo ir gavimo būdus.

Tęsinys kitame puslapyje: 



„DeepSeek“ puola. Silicio slėnyje – panika

Vakarų kompanijos, tokios kaip „OpenAI“, galėjo būti nustebintos, kaip greitai „DeepSeek“ sugebėjo sukurti ir patobulinti tokio tipo sprendimus. Tačiau didžiausias netikėtumas buvo itin mažos išlaidos, kurias patyrė kinai mokydami galutinę savo dirbtinio intelekto modelio „Deep Seek R1“ versiją. Tai turėjo kainuoti tik 5,6 mln. dolerių. Palyginimui, naujausio „OpenAI o1“ modelio mokymo kaina turėjo siekti net 100 mln. dolerių Per trumpą laiką kinai Silicio slėnį ne tik pasivytų, bet ir kai kuriais aspektais jį aplenktų.

 

 

Tai, ką padarė „DeepSeek“, gali išgąsdinti Vakarų technologijų magnatus dėl paprastos priežasties. Dar visai neseniai buvo manoma, kad tokiems pažangiems dirbtinio intelekto modeliams sukurti reikia daug pinigų. Pavyzdžiui, dauguma DI įmonių naudojamos elektronikos buvo paremtos brangiais NVIDIA sprendimais. Dabar paaiškėjo, kad technologijas galima sukurti naudojant pigesnius išteklius.

„DeepSeek R1“ modelio išleidimas yra skirtas parodyti, kad dirbtinio intelekto plėtra gali būti pigesnė, o Vakarai, turintys daug pinigų ar prieigą prie geriausių technologijų, čia neturi pranašumo.

Bet ar tikrai? Kai kurie Vakarų komentatoriai pažymi, kad „DeepSeek“ startuolis iš tikrųjų nuslėpė informaciją apie tikrąsias DI modelio sukūrimo išlaidas.

„DeepSeek“ nėra toks ypatingas?

 

 

Oficialiai „DeepSeek“ tikina, kad kurdama R1 disponavo nedaug NVIDIA H800 grafikos procesorių (specialiai modifikuotų ir susilpnintų H100 modelių, skirtų Kinijos rinkai).

Nepaisant to, „Scale AI“ vadovas Alexanderis Wangas pareiškė, kad „DeepSeek“ meluoja. Anot jo, startuolis gali turėti net 50 000 geresnės H100 versijos grafikos procesorių. Be to, Dylanas Patelis iš „SemiAnalysis“ pažymėjo, kad norint pateikti tikrąsias „DeepSeek R1“ modelio sukūrimo išlaidas, reikėtų pažvelgti į visą procesą ir visų grafikos procesorių pirkimus per visą į Kinijos startuolio veiklą – vien nuo 2020 metų jis galėjo išleisti 500 mln. dolerių.

Teigiama, kinai sukūrė „DeepSeek R1“ modelį taip greitai, nes pavogė kai kuriuos „OpenAI“ duomenis. Be anksčiau minėto bendrovės ir „Microsoft“ tyrimo, didelę tokio įvykio tikimybę nurodė Donaldo Trumpo patarėjas dirbtinio intelekto klausimais Davidas Sacksas.

Tačiau kad ir koks pažangus „DeepSeek“ modelis būtų šiuo metu, jis jau sukėlė didelę sumaištį ir žalą Amerikos technologijų magnatams.

Pasidalinkite su draugais
Aut. teisės: MTPC
MTPC
(6)
(0)
(6)
MTPC parengtą informaciją atgaminti visuomenės informavimo priemonėse bei interneto tinklalapiuose be raštiško VšĮ „Mokslo ir technologijų populiarinimo centras“ sutikimo draudžiama.

Komentarai ()