Neįtikėtina, bet DI pamatęs šiuos žmogaus kūrinius „išprotėja“ – ir tai gali būti žmonijos išsigelbėjimo priemonė (Foto) ()
Dirbtinis intelektas iš prigimties yra „trapus“, tai reiškia, kad jis negali suprasti absoliučiai visko.
Prisijunk prie technologijos.lt komandos!
Laisvas grafikas, uždarbis, daug įdomių veiklų. Patirtis nebūtina, reikia tik entuziazmo.
Sudomino? Užpildyk šią anketą!
Dirbtinis intelektas (DI), artėjantis prie singuliarumo – taško, kuriame jis pranoksta žmogaus intelektą – sukėlė diskusijas, kaip geriausia jį suvaldyti. Nors superinteligentiškos sistemos gali pakeisti mūsų žinomą gyvenimą, nerimaujama, kad jos gali padaryti daugiau žalos nei naudos. DI ribotumas yra vienas iš geriausių įrankių, leidžiančių mums geriau suprasti, koks iš tikrųjų yra atotrūkis tarp mašinos ir žmogaus intelekto.
Siekdama Elektros ir kompiuterių inžinerijos daktaro laipsnio Delavero universitete, 2021 m. Ishaani Priyadarshini parašė disertaciją apie tai, kaip DI nesugeba iššifruoti memų ir kaip tai galėtų mums padėti kovoje prieš singuliarumą. „Interneto memai yra puikūs kontroliniai taškai, užtikrinantys, kad žmonės turėtų pranašumą prieš mašinas, taip neleidžiant mašinoms suprasti memų ir pranokti žmogaus intelektą“, – sako ji.
Memai prieš superinteligentiškas mašinas
Prieš dirbdama su dirbtiniu intelektu, Priyadarshini buvo susijusi su kibernetiniu saugumu, ir ji pastebėjo, kad daugiau nei 50 procentų interneto sudaro robotai – kai kurie iš šių robotų yra geri, o kiti turi kenkėjiškų ketinimų.
Tai patvirtino didžiausią jos baimę: jei dirbtinis intelektas taptų nuovokus, tai gali sukelti katastrofą mūsų internetiniams duomenims ir privatumui. „Jis galės gauti visą informaciją, esančią kibernetinėje erdvėje – ateityje tai gali sukelti katastrofiškų rezultatų“, – sako Priyadarshini.
Jos tikslas buvo rasti saugumo priemonę, kuri galėtų nugalėti DI dar nepasiekus šio taško. Atsakymas? Memai. Šie stebėtinai sudėtingi teksto ir vaizdų deriniai dažnai yra humoristinis popkultūros ir dabartinių įvykių atspindys ir paprastai skelbiamos socialinės žiniasklaidos platformose.
Priyadarshini norėjo išsiaiškinti, kodėl DI taip prastai dekoduoja memus ir kaip humoristiniai įrašai ateityje galėtų būti naudojami kaip kibernetinio saugumo priemonė. DI nesugebėjimas suprasti memų yra daugialypis, tačiau didžioji dalis to yra susiję su tuo, kad jie dažniausiai yra dviprasmiški. Priyadarshini sako, kad mūsų supratimas apie memus labai priklauso nuo mūsų pačių gyvenimo patirties. „Mašinai memai yra tik teksto ir vaizdų krūva“, - aiškina ji.
Jau esame sukūrę dirbtinį intelektą, galintį atpažinti tekstą ir veido išraiškas, tačiau memų taisyklių tikrai nėra. Žinoma, optinis simbolių atpažinimas (Optical Character Recognition, pažangi sistema, galinti atpažinti tekstą vaizduose) jau gali būti naudojama tiksliai nuskaityti valstybinius automobilių numerius, tačiau sistema jau puikiai žino, kur ieškoti – teksto iššifravimas iš memų yra visiškai kitoks.
„Nėra šablono, kuriuo vadovautųsi memai, todėl išgauti tekstą iš jų yra tikrai sudėtinga“, – sako Priyadarshini. Galite ginčytis, kad dauguma memų yra tik to paties šablono variantai, tačiau tas pats memas vis tiek gali būti interpretuojamas labai skirtingai, atsižvelgiant į įterptą turinį.
Memai yra daug sudėtingesni, nei mes manome
Šiuo metu neįsivaizduojame, ar dirbtinis intelektas turi gebėjimą būti jausmingas, o tai reiškia, kad jis galėtų mąstyti pats ir priimti sprendimus; net jei žinotume, neaišku, kaip išmatuotume DI jautrumą. Galime išmatuoti DI gebėjimą išgauti emocijas iš teksto ir veido išraiškų – ir tai jau yra gana nerami tendencija, kai emocijos paimamos iš teksto fragmentų. Bet milijardai permutacijų* (iš anksto numatytas, genetiškai programuotas genomo arba genų pertvarkos būdas) kurias rasite tiek tekste, tiek veido išraiškose, apsunkina DI nulaužti kodą. Tai dar prieš net įtraukiant paties memo kontekstą.
*Permutacija – 1. tam tikro rinkinio elementų sukeitimas arba pertvarkymas, pvz., skaitmenų - skaičių sekoje, sakinio dalių - sakinyje; 2. kiekvienas galimas tų elementų rinkinys.
„Memų supratimas gali amžinai tapti iššūkiu DI ir išlikti neišsprendžiama problema“, – sako Priyadarshini savo disertacijoje.
Nepaisant to, kad memai yra ne kas kita, kaip vaizdai internete, jų „išpakavimo“ procesas iš tikrųjų yra daug sudėtingesnis, nei manėme. Žmogaus smegenys turi fantastišką gebėjimą labai greitai išanalizuoti neįsivaizduojamą duomenų kiekį – tai padeda suprasti memus per kelias sekundes.
Konteksto supratimas
Be gyvenimiškos patirties DI neturi daug konteksto, į kurį būtų galima pasiremti. Prisimenate 2021 m. Sueco kanalo memus, kai „Ever Given“ įstrigo kanale? Kaip pavyzdį naudokime toliau pateiktą memą:
What is happing in #SuezCanal today explained.#Egypt
— Zaina Erhaim #FreeAlaa (@ZainaErhaim) March 24, 2021
pic.twitter.com/T06bFDGQ7q
DI gali atpažinti, kad vaizdo įraše yra konteinerinis laivas. Tačiau ar gali tinkamai identifikuoti jį kaip „Ever Given“, kuris užplaukė ant seklumos Sueco kanale? Bet to, yra dar vienas sudėtingumo sluoksnis – kodėl video yra kino personažas Austinas Powersas? Ar DI žino, kad Austino Powerso filmų serija turėtų būti juokinga? „DI gali būti nelengva užduotis suprasti interneto memus, atsižvelgiant į daugybę ir įvairių memų, randamų internete, ir į skirtingus modelius, kuriuos gali sukurti kiekvienas iš memų“, – sako Priyadarshini savo disertacijoje, kuri buvo paskelbta žurnale „Computers, Materials, and Continua“.
Tuo tarpu žmogaus smegenys panaudoamos labai mažai pastangų labai lengvai suveda paralelę tarp Austino Powerso ir konteinerinio laivo, manevruojančio iš Sueco kanalo.
Elgsenos ir duomenų mokslininkas Pragya Agarwal atskleidžia, kad žmogaus smegenys kas sekundę gali apdoroti maždaug 11 milijonų informacijos bitų – tai yra 0,011 gigabitų per sekundę. Tačiau mūsų sąmoningas protas (pripildytas mums žinomų minčių) gali „pavežti“ tik apie 40–50 bitų per sekundę.
Laimei, mūsų smegenų migdolinis kūnas gali suderinti naują informaciją su jau egzistuojančiais stereotipais ir šablonais.
Net jei DI galėtų sėkmingai iššifruoti memus, tai tik viena galvosūkio dalis. Interneto memai sparčiai auga, o tai reiškia, kad dirbtinis intelektas turi neatsilikti. Tai, kas buvo juokinga praėjusią savaitę, po kelių dienų gali būti laikoma sena naujiena. Pavyzdžiui, „ChatGPT“ (DI pokalbių robotas) buvo apmokytas naudoti tik interneto informaciją sukurtą nuo 2021 m.
Humoras ir DI nesimaišo (kol kas)
Būti juokingam yra neįtikėtinai sudėtingas įgūdis, kuris skirtingiems žmonėms gali reikšti skirtingus dalykus. Dėl šio subjektyvumo DI sunku suprasti humorą – atminkite, kad tik kai kuriems žmonėms viena turinio dalis gali atrodyti juokinga. Priyadarshini mini, kad dirbtinis intelektas galėtų išanalizuoti humoro serialo „Biuras“ (The Office) ekrano nuotraukas ir sužinoti, kad tai komedija, tačiau jis negalėtų suprasti humoro kiekvienoje scenoje.
„Tikrasis iššūkis kyla identifikuojant įvairias humoro rūšis tuose sakiniuose ar vaizdo įrašuose“, – sako Priyadarshini. Čia kalbame tik apie bendrą humorą, bet yra ir juokelių, kurie gali būti juodo, šmaikštaus ar net sauso humoro. „Mes taip pat nežinome, koks yra tikrasis humoro jausmas – kiekvienam jis skirtingas“, – sako Priyadarshini. Jei DI nėra jautrus, neaišku, ar jis kada nors sugebės visiškai suprasti humorą.
Futuristinė CAPTCHA
Kaip atrodys naujo lygio CAPTCHA (skirta atskirti kompiuterius ir žmones) realaus pasaulio programoje? Vietoj to, kad įvestumėte keistą tekstą ar pasirinktumėte, nuotraukų fragmentus, kuriose yra tiltai ar šviesoforai, turėsite iššifruoti memo reikšmę.
Priyadarshini pateikė teorinį atominės elektrinės autentifikavimo sistemos pavyzdį. Darbuotojas pradės, kaip įprasta, įvesdamas savo vartotojo vardą ir slaptažodį. Kai tai bus padaryta, jam bus pateiktas memas. Šiuo atveju Priyadarshini pasinaudojo Chubby Bubbles memo atvejį (žr. pav.), kai vartotojui bus pateikti keturi šansai nustatyti, kas vyksta paveikslėlyje.
Whenever I look at this Purple Pikmin on my desk my mind goes back to the chubby bubbles meme... #Pikmin #Pikmin4 #PikminBloom pic.twitter.com/c7sgMYqK5i
— 3D-Böy (@ZatchMehr) September 19, 2022
Vis dar turime daug klausimų apie tai, kaip tokio tipo bandymai veiktų praktiškai, tačiau tai nauja idėja, galinti pakeisti kibernetinio saugumo ateitį.