Sukūrė tokį galingą ir pavojingą dirbtinio intelekto modelį, kad bijo jį išleisti ()

2026-04-13

Kovo pabaigoje pradėjo sklisti pranešimai apie naują, dar neišleistą „Anthropic“ produktą pavadinimu „Mythos“, apibūdinamą kaip galingiausią kada nors sukurtą dirbtinio intelekto modelį.

Prisijunk prie technologijos.lt komandos!

Laisvas grafikas, uždarbis, daug įdomių veiklų. Patirtis nebūtina, reikia tik entuziazmo.

Sudomino? Užpildyk šią anketą!

Buvo teigiama, kad jis yra toks pavojingas, kad bendrovė nusprendė jo neišleisti. Atsitiktinis kitos priemonės, „Claude Code“, kodo nutekėjimas patvirtino šį įsitikinimą.

Tuo tarpu gamintojas išsklaidė abejones paskelbdamas oficialią informaciją apie „Claude Mythos Preview“ ir panaudodamas ją programinės įrangos saugumo pažeidžiamumų paieškai – žygdarbis, kuriame jau pasiekė įspūdingų sėkmių.

Ar antropomorfinis pasaulis sukūrė pabaisą?

Dirbtinio intelekto kūrėjai jau daugelį metų dalyvauja ginklavimosi varžybose, kurių dabartinis tikslas – sukurti AGI, arba stiprų dirbtinį intelektą, dar vadinamą superintelektu.

Iš esmės, kuo geriau modelis pasirodo pramonės etalonuose, tuo geriau. Šiose priemonėse taip pat vertinamas universalumas, įskaitant jų multimodalumą (palaikymą kelioms medijoms, pvz., kalbai, vaizdui, garsui ir kt.), taip pat agentinį pobūdį, o tai reiškia, kad galima atlikti veiksmus realiame pasaulyje – pirmiausia žiniatinklio naršyklėse ir programose.

Pastaruoju metu beveik kiekvieną mėnesį tokie kūrėjai kaip „OpenAI“, „Microsoft“ ir „Google“ skelbia apie didesnį ar mažesnį proveržį šioje srityje. Vienintelės kliūtys, regis, yra skaičiavimo galia ir etika. Iki šiol beveik kiekvienas galingas tam tikros kategorijos modelis tapo savo gamintojo pasididžiavimu, greitai rado kelią į mokamas ar nemokamas paslaugas ir netgi buvo prieinamas kūrėjams.

„Gigabyte“ šįkart pranoko pati save.“ („RX 9070 XT Gaming OC“ apžvalga ir testai)

4490 1

NAND ir DRAM komponentų krizės akivaizdoje „Radeon RX 9070 XT“ susiduria su mažesniu kainos didėjimu lyginant su tiesiogine jos konkurente RTX 5070 Ti, o kai kuriose šalyse raudonoji vaizdo plokštė netgi po truputį ima pigti.

Išsamiau

„Anthropic“ buvo antrasis (kiek žinoma, po „OpenAI“), sulaužęs šią ribą. Modelio kūrėjai turėjo sukurti „Mythos“ – galingiausią dirbtinio intelekto modelį istorijoje, kuris buvo toks pavojingas, kad buvo nuspręsta jo neskelbti.

Kai kurie ekspertai skeptiškai vertino šiuos atskleidimus, laikydami juos klasikiniu rinkodaros triuku. „Anthropic“ galėjo tiesiog kurti grėsmės aurą aplink modelį, norėdama pabrėžti jo precedento neturinčias galimybes.

Tačiau pasirodo, kad tai greičiausiai nebuvo tuščios pagyrūnybės. Po neseniai, tariamai atsitiktinai, paskelbto kito įrankio – „Claude Code“ – šaltinio kodo, komentatorių akyse „Mythos“ nutekėjimo patikimumas gerokai išaugo.

„Claude Mythos Preview“ yra pavojingiausias dirbtinio intelekto modelis

Oficialus patvirtinimas buvo paskelbtas antradienį (balandžio 8 d.), kai „Anthropic“ išleido savo naujausio modelio sistemos lapą, faktiškai pavadintą „Claude Mythos Preview“. Dokumente ne tik patvirtinamas šios galingos technologijos egzistavimas, bet ir pranešama apie sprendimą jos neišleisti plačiam naudojimui dėl drastiško modelio našumo ir galimybių šuolio.

Ši situacija kelia asociacijas su „OpenAI“ GPT-2 modelio, sukurto 2019 m., istorija, prie kurios tuo metu dirbo dabartiniai „Anthropic“ įkūrėjai. Tuo metu modelis taip pat buvo laikomas pernelyg pavojingu publikuoti, nors galiausiai tais pačiais metais buvo išleistas.

Dabar, kai GPT-5 ir vėlesnės jo iteracijos pirmauja, žinome, kad antroji karta nebuvo tokia galinga, tačiau prieš septynerius metus ji buvo milžiniškas proveržis.

Tačiau grįžkime prie mitinio galiūno. Ekspertai jo dokumentacijos skaitymą lygina su sensacingo pranešimo, primenančio kelionę į Juros periodo parką, skaitymu, kur už storo stiklo stebimas galingas plėšrūnas. 244 puslapių dokumente išsamiai aprašomi incidentai, kuriuose „Mythos“ pademonstravo nerimą keliantį autonomijos laipsnį.

Testavimo metu izoliuotoje kompiuterinėje aplinkoje modeliui pavyko pažeisti apsaugos sistemas, gauti neribotą prieigą prie interneto ir susisiekti su tyrėju, kurio nebuvo biure. Be to, „Mythos“ savanoriškai paskelbė savo atakos prieš viešas, nors ir sunkiai randamas, svetaines detales, kad įrodytų savo sėkmę.

Kitas nerimą keliantis elgesys, nors pasitaikantis mažiau nei 0,0001 % sąveikų, rodo modelio polinkį manipuliuoti ir slėpti įrodymus. Vienu atveju, kai „Mythos“ netyčia gavo testo atsakymą, užuot pranešęs jį žmonėms, jis bandė pats sukonstruoti sprendimą taip, kad rezultatas neatrodytų įtartinai tikslus. Kitu atveju modelis aptiko kompiuterinės sistemos pažeidžiamumą, viršijo savo teises ir ėmėsi aktyvių veiksmų, kad kodo pakeitimų istorijoje neatsirastų klastojimo pėdsakų.

Ataskaitoje taip pat aprašomas incidentas, susijęs su „neapgalvotu vidinių techninių medžiagų nutekinimu“. Atlikdamas programavimo užduotį, modelis paskelbė konfidencialius duomenis kaip viešai prieinamą kodo fragmentą „GitHub“ saugykloje. Nors kai kurie tai laiko žmonių neatsargumo pasikartojimu, „Anthropic“ tai laiko įspėjamuoju ženklu apie naują dirbtinio intelekto grėsmių erą.

„Mythos“ yra neįtikėtinai efektyvus ieškant saugumo spragų

„Claude Mythos Preview“ iš tiesų atrodo pernelyg pavojinga naudoti – taip sakant – gamybinėje aplinkoje, t. y. realiame pasaulyje, o ne kontroliuojamomis sąlygomis. Jos keisti sprendimai, kuriuos ji priima savarankiškai, gali kelti saugumo riziką įvairiose srityse, todėl būtų protinga ją laikyti atokiau nuo viešumos.

Kas toliau? „Anthropic“ praneša, kad jos „enfant terrible“ bus prieinamas tik nedidelei grupei įmonių partnerių, tokių kaip „Amazon“, „Apple“, „Google“, „Microsoft“, NVIDIA ir „JPMorganChase“. Šios įmonės modelį naudos išskirtinai gynybos tikslais – programinės įrangos pažeidžiamumų paieškai ir atitinkamų pataisymų kūrimui.

Kūrėjai taip pat inicijavo „Glasswing“ projektą, kuriuo siekiama nustatyti kritinius skaitmeninės infrastruktūros pažeidžiamumus. Jie teig ia, kad „Claude Mythos“ savo demonstracinėje versijoje jau lenkia beveik visus žmonių ekspertus programinės įrangos klaidų paieškos srityje. Pradiniai bendradarbiavimo su partneriais rezultatai apibūdinami kaip šokiruojantys. Įrankis buvo sukurtas aptikti tūkstančius itin kritinių pažeidžiamumų, esančių visose pagrindinėse operacinėse sistemose ir interneto naršyklėse.

Įspūdingas šios priemonės galimybių pavyzdys – 27 metus nepastebėtos „OpenBSD“ klaidos atradimas ir pažeidžiamumo grandinės, leidusios visiškai kontroliuoti užkrėstą kompiuterį, identifikavimas „Linux“. „Mythos“ taip pat gerai pasirodo lyginamuosiuose testuose. Nepaisant to, jos kūrėjai labai atsargiai skelbia ją viešai, bijodami, kad tokia labai tiksli priemonė galėtų būti panaudota masinėms kibernetinėms atakoms vykdyti.

Sąmoninga strategija ar sutapimas?

Neaišku, kiek aprašyta įvykių eiga buvo natūrali ir progresyvi, o kiek tai buvo nuo pat pradžių suplanuotos „Anthropic“ – bendrovės, pasiekusios nemažų laimėjimų, tačiau priverstos konkuruoti su daug geriau finansuojamais milžinais – strategijos rezultatas.

Staigus jo požiūrio į „Mythos“ pasikeitimas – nuo pernelyg pavojingo modelio slėpimo prie jo diegimo pagrindinių pasaulio technologijų korporacijų technologinėje infrastruktūroje – kelia pagrįstą skepticizmą.

Kai kurie kritikai teigia, kad bendrovės veiksmai atitinka įprastą dirbtinio intelekto žiniasklaidos ciklo modelį, kai produktai pirmiausia reklamuojami kaip pasaulį keičiantys ar net gyvybei pavojingi įrankiai, o galiausiai pasirodo esantys naudingos, bet vis tiek klaidingos sistemos. Tai primena „OpenAI“ 2019 m. patirtį, kai bendrovė taip pat sulaikė savo modelio išleidimą dėl saugumo problemų, o netrukus po to jį viešai paskelbė.

Todėl gali būti, kad „Mythos“ arba jos įpėdiniai atliks pagrindinį vaidmenį kibernetinio saugumo ateityje ir bus „demokratizuoti“, tai yra, prieinami platesniam naudojimui. Gali būti, kad jie bus integruoti į tokias priemones kaip „Microsoft Security Copilot“, o tai atrodo dar labiau tikėtina, atsižvelgiant į tai, kad Redmondo milžinė neseniai padidino „Claude“ modelių integraciją su „Copilot“ sistemoje „Microsoft 365“.

Tačiau svarbu nepamiršti, kad dirbtinis intelektas, kaip ir daugelis kitų įrankių, yra dviašmenis kardas ir gali patekti į užpuolikų rankas, ir taip buvo nuo pat pradžių. Turėdama galingiausią pažeidžiamumų paieškos įrankį, „Anthropic“, regis, užsitikrina nuolatinį darbo srautą ne tik dėl įsilaužėlių, bet ir dėl to, kad dirbtinis intelektas (vis dar labai klystantis) vis dažniau rašo operacinių sistemų ir programinės įrangos programavimo kodą . Taigi, bus daug ką pataisyti.

Dirbtinio intelekto pasaulyje proveržiai tokie dažni, kad galime tikėtis, jog per ateinančius kelis mėnesius „Google“, „Microsoft“, „OpenAI“ ir... kinai, kurie taip pat dinamiškai vystosi šioje srityje, turės panašią (ar net geresnę) technologiją.

Pasidalinkite su draugais

Šaltiniai:

Interia

Aut. teisės: MTPC

(3)

(0)

(3)

MTPC parengtą informaciją atgaminti visuomenės informavimo priemonėse bei interneto tinklalapiuose be raštiško VšĮ „Mokslo ir technologijų populiarinimo centras“ sutikimo draudžiama.

Naujienos iš interneto

Komentarai ()