Dirbtinio intelekto amžiuje prasidės nauja muzikos era: kas tai yra šabloninė muzika ir kokia bus muzika be kompozitoriaus (Video) (2)
Dirbtinio intelekto pagalbos naudojimas mūsų dienomis palietė ne tik mokslą, bet ir masinę kultūrą. Praeitais metais kino pasaulį apskriejo žinia, jog garsiojo serialo Sostų karai scenarijų kurs ne legendinis rašytojas George Martinas, bet dirbtinis intelektas. Muzikos ir matematikos ryšys visada buvo glaudus, nes fundamentaliai žiūrint, vien muzikos garso organizavimo parametrai tokie kaip ritmas, garso aukštis bei garsų santykiai nurodo į matematinį tikslumą.
Prisijunk prie technologijos.lt komandos!
Laisvas grafikas, uždarbis, daug įdomių veiklų. Patirtis nebūtina, reikia tik entuziazmo.
Sudomino? Užpildyk šią anketą!
XX amžiuje gyvenęs graikų tautybės kompozitorius Iannis Xenakis (1922-2001) tiksliųjų mokslų principus perkėlė į savo kūrinius bei paliko visą veikalą muzikos ir tiksliųjų mokslų santykiui tirti (Formalizuota muzika: Mąstymas ir matematika kompozicijoje, 1963). Tačiau gyvenant dirbtinio intelekto amžiuje galime savęs paklausti, ar muzikai reikia tebereikia kompozitoriaus? Ar technologijos jau yra pakankamai pažengusios, jog be mūsų išsikišimo, o tiesiog apdorojusios tam tikro stiliaus ir kiekio muzikos dirbtinis intelektas galėtų kurti tūkstančius valandų muzikos? Į šiuos klausimus bandysiu atsakyti šiame straipsnyje.
Šabloninė muzika, ar tai naujas reiškinys?
Muzikos istorijoje jau yra buvę bandymų organizuoti garsą remiantis tam tikrais algoritmais. Vienas iš tokių pavyzdžių gali būti Markovo grandinės. Markovo grandinės yra atsitiktinis procesas, kuriame ateities būsena priklauso tik nuo vienos praeities būsenos – t. y. muzika yra generuojama įsimenant santykinius sekų dažnius ir generuojant ėminius (angl. Sampling) atitinkančius šį pasiskirstymą.
Tačiau dauguma bandymų buvo nevykę, muzika skambėdavo pernelyg mechaniškai (ko gero dėl to, jog joks bandymas neturėjo ilgalaikės atminties). Tačiau muzikos generavimo uždaviniui pritaikyti dirbtiniai neuroniniai tinklai sugeba kurti sudėtingesnės struktūros muziką. Šabloninė muzika nuo kitos muzikos žanrų/formų skiriasi tuo, jog ji nereikalauja žmogaus išsikišimo, o tik pavyzdžių (medžiagos), kurių pagrindu remiantis dirbtiniai neuroniniai tinklai kuria muziką.
Kaip tai veikia?
Dirbtiniai neuroniniai tinklai yra matematinės funkcijos/algoritmai, kurie buvo įkvėpti biologinių neuroninių tinklų. RNN (liet. Rekurentiniai neuroniniai tinklai) yra dirbtinių neuroninių tinklų tipas, skirtas modeliuoti sekas (pvz. garsų sekos, tekstas ir kt.). Šie tinklai yra taikomi apdoroti sekų (laiko, ar kitokią) informaciją ir generuoti naujas sekas. RNN veikimo principas pagrįstas įsimenama informacija tarp laiko eilutės žingsnių, kas yra ypač svarbu modeliuojant muzikines sekas, kuriose būsimi įvykiai priklauso nuo anksčiau buvusių įvykių, dėl to rekurentinis neuroninis tinklas gali atkurti pavyzdinę garsų seką, kuri turi tokią pačią laiko eilutės struktūrą (šablonai, motyvai).
LSTM neuroniniai tinklai
Tačiau paprastas RNN tinklas pasižymi prasta ilgalaike atmintimi, todėl buvo sukurta patobulinta RNN architektūra – LSTM (angl. Long-short term memory). Trumpos-ilgos atminties tinklas tai rekurentinis tinklas (RNN) naudojantis papildomą grįžtamąjį ryšį (atminties celes c(t)), siekiant geriau išsaugoti ("atsiminti") paskutinius periodo įėjimo signalus.
Rekuretiniai neuroniniai tinklai yra gan universalūs, tad juos galima pritaikyti ir muzikoje. Jūsų dėmesiui, vaizdo įrašas, kuriame RNN sukuria Bacho stiliaus muziką remiantis dvejomis kompozicijomis iš Johanno Sebastiano Bacho (1685-1950) klavyro kūrinių (BWV 772-994):
Visai taip, kaip ir nurodyta schemoje, RNN gavo du pavyzdžius, iš kurių atliekant matematines procedūros kartojimus (interacijas) buvo judama link galutinio rezultato. Po 15000 interacijų gautas rezultatas yra neblogas, tai rodo, jog šabloninė muzika išties turi puikų potencialą tapti naujos rūšies muzika.
Įsivaizduokite, jog kažkada apsilankę Spotify galėsite nurodyti kokios tiksliai muzikos norite gauti (25% Pink Floyd ir 75% Jefferson Airplane).
Douglas Eck ir Jürgen Schmidhuberio tyrime A First look at music composition using LSTM Recurrent Neural networks paaiškėjo, jog naudojant RNN potencialiai įmanoma kurti begalinę bliuzo muziką. Iš kitos pusės turime pripažinti faktą, jog duomenys t. y. muzika sukurta iki dabar išsisems, jei nebus tų, kurie plėstų muzikinę medžiagą, iš kurios RNN gebėtų kurti muziką.
Taip pat kyla klausimas, ar dirbtinis neuroninis tinklas sugebėtų kurti ne instrumentinę, bet didelės apimties muzikos kūrinį (tarkime operą), nes tokiam kūriniui reikia sukurti tekstus, kurie byloja apie tam tikrus vaizdinius bei apie tam tikrą idėją. Šalia to, RNN vis dar (tai tik laiko klausimas) kada galės remtis muzikos teorija ir tokiu būdu dar kokybiškiau kurti tam tikro stiliaus šablonus. Ši spraga girdima RNN sukurtoje Bacho stiliaus muzikoje, todėl būtų nesąžininga teigti, jog interacijų rezultatas yra puikus arba geras.
Tačiau vilties teikia LSTM sistema. Minėtame eksperimente tapo aišku, jog kad LSTM sėkmingai išmoko bliuzo muzikos formą ir autorių žodžiais sakant sugeba kurti naujus (ir mes tikime malonias) melodijas tokiu stiliumi. Nepaprasta ir tai, kad tinklas surado atitinkamą struktūrą, jis nenukrypsta nuo jo: LSTM sugeba groti bliuzą su geru laiku ir tinkama struktūra tol, kol kažkas nori to klausytis. Tai reiškia, jog LSTM sistema sugeba kurti neribotą kiekį muzikos.
Kaip vyksta muzikos komponavimas naudojant LSTM galite pamatyti žemiau esančiame video:
Vienas iš svarbiausių dalykų, kuris paaiškėjo šiame eksperimente yra tai, jog LSTM sugebėjo perprasti duotų bliuzo akordų sandarą ir tokiu būdu juos varijuoti. Turint omenyje kokiu greičiu technologijos žengia į priekį, yra didelė tikimybė, jog sąlyginai greitai nebeturėsime dilemos ieškant naujos mėgstamiausios muzikos, o užteks tiesiog pasirinkti mėgstamus šablonus ir mėgautis nauja muzika be grupės ar kompozitoriaus.
Šaltiniai:
- https://www.15min.lt/mokslasit/straipsnis/technologijos/nauja-sostu-zaidimo-sezono-scenariju-kuria-dirbtinis-intelektas-646-847042
- Eck, Douglas; Schmidhuben, Jürger A First look at Music Composition using LSTM Recurrent Neural Networks IDSIA, Šveicarija.
- Computational Intelligence in Music, Sound, Art and Design (Sud. Anikó Ekart), Šveicarija, Springer p. 164.
- Dovydaitis, Laurynas; Rudžionis, Vytautas Diktoriaus identifikavimo tikslumo tyrimas naudojant neuroninius tinklus, Straipsnio ID: mla.2018.3464
- Computational Intelligence in Music, Sound, Art and Design (Sud. Anikó Ekart), Šveicarija, Springer p. 163.
- A First look at Music Composition using LSTM Recurrent Neural Networks p.3