Straipsnius analizuojanti programa pateiks tikrąją leidinių nuomonę (1)
„Didinkite mokesčius!“ šaukia viena antraštė. „Mažinkite išlaidas!“ spiegia kita. Ir ką gi galima suprasti iš naujienų, kai jose pateikiami tokie tarpusavy prieštaraujantys požiūriai? Galbūt suprasti padės naujas įrankis – programinė įranga, peržvelgianti naujienų straipsnius ir identifikuojanti asmenis ar organizacijas, kurių požiūriai tam tikru klausimu yra prieštaringi. Programa nustato ryšį tarp nesutariančių pusių ir išsiaiškina kas yra vieno ar kito straipsnio šalininkas, rašo newscientist.com.
Prisijunk prie technologijos.lt komandos!
Laisvas grafikas, uždarbis, daug įdomių veiklų. Patirtis nebūtina, reikia tik entuziazmo.
Sudomino? Užpildyk šią anketą!
„Projekto tikslas – padėti skaitytojams įvertinti skirtingus požiūrius ir aiškiau suvokti naujienas“, - sako Korėjos pažangiojo mokslo ir technologijų instituto (Pietų Korėja) informatikos specialistas Souneilas Parkas.
S. Parko metodas identifikuoja straipsniuose minimas oponuojančias puses, ieškodamas tiesioginių ir netiesioginių citatų. Tiesioginės citatos yra tos, kurios įrėminamos kabutėmis, o netiesioginės atpažįstamos pagal tokius veiksmažodžius, kaip „teigė“, „kritikavo“ ar „paaiškino“. Pavyzdžiui „Vyriausybė paaiškino, kad jos mokesčių politiką kritikuoja opozicija“.
Programinė įranga atpažįsta ir teigiantįjį, ir tas puses, apie kurias užsimenama. Pagal tai nustatomas ginče dalyvaujančių pusių tarpusavio požiūris. Tuomet nustatomi du pagrindiniai debatuose dalyvaujantys oponentai, o kitos šalys suskirstomos pagal jų sąsajas su pagrindiniais.
Pavyzdžiui, išanalizavus straipsnius apie 2010 m. vykusį „Cheonan“ laivo paskandinimą, kuomet Pietų Korėjos laivą, kaip manoma, paskandino Šiaurės Korėjos povandeninis laivas, Pietų ir Šiaurės vyriausybės įvardintos kaip pagrindiniai oponentai, o kitų šalių vyriausybės daugiausiai komentavo šių dviejų vyriausybių žodžius ir sprendimus.
S. Parkas su kolegomis santykius nustatinėja taikydami algoritmą, panašų į „Google PageRank“, kuris tinklalapių svarbą nustato pagal nuorodas į juos ir iš jų. Tačiau ši programinė įranga vertina ne nuorodas, o tai, kaip kritikuoja ir yra kritikuojamas vienas konkretus ginčo dalyvis. Pagrindiniai oponentai būna tie, tarp kurių sklando daugiausiai abipusės kritikos.
Nustačius ginčo pusių santykius, mokslininkai klasifikuoja straipsnius pagal tai, kurią pagrindinių ginčo dalyvių pusę jie remia. Klasifikacija priklauso nuo citatų kiekio straipsnyje ir kažkuriai pusei straipsnis priskiriamas tuomet, kai teigiamų citatų procentinė dalis pasiekia tam tikrą ribą. Šios ribos nepasiekę straipsniai priskiriami trečiai neutraliai kategorijai.
Mokslininkai programinę įrangą išbandė su 250 straipsnių, aprašančių 14 skirtingų temų ir nustatė, kad programa gali teisingai nustatyti dvi pagrindines ginčo puses maždaug 70 proc. straipsnių. Programai nepavyko klasifikuoti straipsnių, kuriuose mažai citatų arba straipsnių, kuriuose dažnai cituojamas kritikuojamas asmuo. S. Parkas mano, kad tokios naujienų surinkimo sistemos, kaip „Google News“ galėtų naudotis jo įrankiu ir skaitytojams pateikti aiškesnį požiūrį į opesnius klausimus. Šiuo metu programinė įranga skirta analizuoti korėjietiškus straipsnius, tačiau modifikavus ją galima būtų taikyti anglų ar bet kuriai kitai kalbai.