Didieji duomenų masyvai: aukso gysla, į kurią krypsta verslo žvilgsnis (0)
Internetui tampant vis svarbesne mūsų gyvenimo dalimi, pasaulyje sparčiai auga sukuriamų duomenų kiekis. Nors duomenys visada turėjo strateginę reikšmę, dėl šiandieninės jų apimties ir žmonių galimybių juos apdoroti jie tampa nauja turto klase.
Prisijunk prie technologijos.lt komandos!
Laisvas grafikas, uždarbis, daug įdomių veiklų. Patirtis nebūtina, reikia tik entuziazmo.
Sudomino? Užpildyk šią anketą!
Tos įmonės bei valstybės, kurios sugebės analizuoti didelės apimties duomenis (angl. big data), padaryti įžvalgas ir tinkamai panaudoti šią informaciją, sulauks didžiulės sėkmės. Vis dėlto pakeliui į sėkmę laukia ir iššūkiai – tai duomenų analizės instrumentų, žinių, patirties trūkumas bei vartotojų pasitikėjimo klausimai.
Internetas plinta ne tik geografine prasme, jis vis labiau skverbiasi ir į kiekvieno iš mūsų gyvenimus. Jau įprastu reiškiniu tampa ne tik prie interneto prijungtas kompiuteris, planšetė ar išmanusis telefonas, bet ir televizorius, automobilis, laikrodis, šildymo sistema, šaldytuvas ar kiti daiktai. Tinklo įrangos gamintoja „Cisco“ prognozuoja, kad 2017 m. vienam žmogui pasaulyje teks vidutiniškai trys prie interneto prijungti daiktai, o 2020 m. tokių įrengimų skaičius pasaulyje pasieks net 50 milijardų. Tai svarbu, nes visi asmeniniai bei versle naudojami prie interneto prijungti įrenginiai, jutikliai, taip pat informacija, kuria dalinamės socialiniuose tinkluose, įvestos paieškos per Google, informacija apie pirkinius internetu ir visa kita veikla interneto erdvėje generuoja didžiuosius duomenis (angl. big data). Tai labai didelės apimties, įvairaus formato, dažniausiai nestruktūrizuoti duomenys (nuotraukos, filmukai, įrašai socialiniuose tinkluose), gaunami iš daugybės skirtingų šaltinių realiu laiku.
Remiantis „Cisco“ duomenimis, per paskutiniuosius dvejus metus buvo sukurta 90 proc. visų pasaulyje saugomų duomenų ir net 99 proc. visų pasaulio duomenų yra skaitmeniniai. Pagrindiniai veiksniai, lėmę spartų duomenų apimties augimą, yra susiję ne tik su vis didesne interneto skvarba bei augančiu prie interneto prijungtų įrenginių skaičiumi, bet ir didėjančiu socialinių tinklų ir įvairių aplikacijų populiarumu, jau egzistuojančios informacijos skaitmeninimu ir įvairių procesų (mokėjimų, mokesčių administravimo, balsavimo) migravimu į internetinę erdvę.
Neretai šiandieninis susidomėjimas didelės apimties duomenimis prilyginamas aukso karštinei ar naftos bumui. Manoma, kad didelės apimties duomenų potencialas milžiniškas – jų naudojimas sukuria galimybes patobulinti ar net iš esmės pakeisti verslo procesus, greičiau reaguoti į pasikeitusius vartotojų poreikius bei į pasaulyje vykstančius įvykius. Jie gali pertvarkyti ištisus ekonomikos sektorius, sukurdami prielaidas atsirasti naujoms inovatyvioms, nusistovėjusią tvarką griaunančioms įmonėms, įvairioms naujoms paslaugoms ir produktams. Įmonių ir net valstybių konkurencinis pranašumas vis labiau priklausys nuo sugebėjimo efektyviai panaudoti didžiuosius duomenis, o toliau tobulėjant technologijoms ir augant didžiųjų duomenų panaudojimo galimybėms, kompiuterizuoti sprendimai vis dažniau pakeis nerutinines žmogaus atliekamas veiklas.
Didieji mažmenininkai, tokie kaip interneto milžinė Amazon.com ar amerikiečių prekybos tinklai „Macy‘s“ bei „Mal-Mart“, savo veikloje jau plačiai naudoja didelės apimties duomenų analizę. Įmonės, siekdamos geriau suprasti klientų apsipirkimo įpročius, pateikti labiau jų poreikius atitinkančius pasiūlymus, reklamuoti produktus, informuoti apie akcijas, nuolat analizuoja klientų duomenis. Tai gali būti pirkimų istorija, informacija, talpinama vartotojų socialiniuose tinkluose bei gaunama per įvairius jutiklius, mobiliuosius įrenginius, išmaniuosius telefonus ar net vaizdo įrašus. Tokia duomenų analizė leidžia jiems didinti savo pardavimus ir įgyti konkurencinį pranašumą prieš kitas įmones.
Didelės apimties duomenų analizė ateityje vis daugiau pridėtinės vertės kurs ne tik įmonėms, bet ir visai visuomenei, kadangi leis tiksliau prognozuoti ir greičiau reaguoti į pasaulyje vykstančius įvykius, pavyzdžiui, įvairias epidemijas ar ekonomikos krizes. Jau dabar įrankis „Google Flu Trends“, agreguodamas žmonių paieškas apie gripą ir jo simptomus per Google paieškos sistemą, informuoja apie galimas gripo epidemijas keliomis savaitėmis anksčiau nei apie jas paskelbia oficialūs šaltiniai. Be to, jau kuriami modeliai, paremti didelės apimties duomenų analize, kurie leis stebėti ekonomikos raidą realiu laiku, daug tiksliau prognozuoti jos vystymąsi bei iš anksto numatyti recesijas.
Žvelgiant į Lietuvos verslą, kol kas panašu, kad šioje srityje jis sparčiai atsilieka. Tačiau akivaizdu, kad siekdamas išlikti konkurencingas globalioje rinkoje jis taip pat turės analizuoti ir „įdarbinti“ didelės apimties duomenis. Tai taikytina ne tik mažmeninės prekybos ar paslaugų įmonėms, parduodančioms produktus ar paslaugas tiesiogiai vartotojams, bet ir gamintojams. Pažangių daviklių ir kitų šaltinių generuojamų duomenų analizė pramonėje leistų pasiekti geresnės produkto kokybės, tiksliau aptikti defektus, optimizuoti veiklas bei resursų panaudojimą ir taip sumažinti gamybos sąnaudas. Pavyzdžiui, davikliai Ford Focus elektromobiliuose teikia gamintojui duomenis apie vairuotojų vairavimo įpročius bei informaciją apie tai, kur, kaip ir kada yra įkraunama automobilio baterija. Tai leidžia gamintojui padaryti vertingų įžvalgų apie savo klientus bei tobulinti produktą, o atsakingoms institucijoms lengviau priimti sprendimus dėl elektromobilių įkrovimo tinklo vystymo.
Vis dėlto, nepaisant išaugusio susidomėjimo didžiaisiais duomenimis kol kas pasaulyje panaudojama tik pusė procento visų duomenų – efektyviam jų išgavimui ir analizei vis dar trūksta instrumentų, žinių bei patirties. Ateityje pagrindinis iššūkis efektyviam šių duomenų panaudojimui bus įrankių bei modelių, kurie galėtų apdoroti ir analizuoti didelius nestruktūrizuotų, sparčiai augančių duomenų kiekius, sukūrimas. Ir panašu, jog judama tinkama kryptimi – rizikos kapitalo fondai intensyviai finansuoja startuolius, kurių veikla susijusi su didelės apimties duomenimis. Duomenų analizės sprendimus kuria ir jau veikiantys verslo gigantai, pavyzdžiui, IBM, Microsoft, kuriasi vis daugiau specializuotų įmonių, kurios teikia tokių duomenų analizės paslaugas.
Dar vienas iššūkis yra susijęs su augančiu vartotojų nerimu ir įtarumu dėl to, kaip įmonės naudoja su jais susijusią informaciją. Siekiant atskleisti pilną didžiųjų duomenų potencialą, bus būtina užtikrinti vartotojų pasitikėjimą įmonėmis ir programomis, naudojančioms didžiuosius duomenis. Ypatingas dėmesys turės būti skiriamas klausimams, susijusiems su asmeninių ir anoniminių duomenų naudojimu, teise būti „pamirštiems“ bei atsakomybe, tenkančia įmonėms, nesilaikančioms nustatytų taisyklių. Reguliuojančiųjų institucijų laukia tikrai nelengvas uždavinys, tačiau prie patikimos aplinkos kūrimo privalo prisidėti ir verslo atstovai, kurdami patikimų įmonių reputaciją. Ir vartotojai yra linkę dalintis asmeniniais duomenimis, jei jie mano, kad vertė, kurią jie už tai gauna, atitinka mokamą privatumo kainą.
Internetas plinta ne tik geografine prasme, jis vis labiau skverbiasi ir į kiekvieno iš mūsų gyvenimus. Jau įprastu reiškiniu tampa ne tik prie interneto prijungtas kompiuteris, planšetė ar išmanusis telefonas, bet ir televizorius, automobilis, laikrodis, šildymo sistema, šaldytuvas ar kiti daiktai. Tinklo įrangos gamintoja „Cisco“ prognozuoja, kad 2017 m. vienam žmogui pasaulyje teks vidutiniškai trys prie interneto prijungti daiktai, o 2020 m. tokių įrengimų skaičius pasaulyje pasieks net 50 milijardų. Tai svarbu, nes visi asmeniniai bei versle naudojami prie interneto prijungti įrenginiai, jutikliai, taip pat informacija, kuria dalinamės socialiniuose tinkluose, įvestos paieškos per Google, informacija apie pirkinius internetu ir visa kita veikla interneto erdvėje generuoja didžiuosius duomenis (angl. big data). Tai labai didelės apimties, įvairaus formato, dažniausiai nestruktūrizuoti duomenys (nuotraukos, filmukai, įrašai socialiniuose tinkluose), gaunami iš daugybės skirtingų šaltinių realiu laiku.
Remiantis „Cisco“ duomenimis, per paskutiniuosius dvejus metus buvo sukurta 90 proc. visų pasaulyje saugomų duomenų ir net 99 proc. visų pasaulio duomenų yra skaitmeniniai. Pagrindiniai veiksniai, lėmę spartų duomenų apimties augimą, yra susiję ne tik su vis didesne interneto skvarba bei augančiu prie interneto prijungtų įrenginių skaičiumi, bet ir didėjančiu socialinių tinklų ir įvairių aplikacijų populiarumu, jau egzistuojančios informacijos skaitmeninimu ir įvairių procesų (mokėjimų, mokesčių administravimo, balsavimo) migravimu į internetinę erdvę.
Neretai šiandieninis susidomėjimas didelės apimties duomenimis prilyginamas aukso karštinei ar naftos bumui. Manoma, kad didelės apimties duomenų potencialas milžiniškas – jų naudojimas sukuria galimybes patobulinti ar net iš esmės pakeisti verslo procesus, greičiau reaguoti į pasikeitusius vartotojų poreikius bei į pasaulyje vykstančius įvykius. Jie gali pertvarkyti ištisus ekonomikos sektorius, sukurdami prielaidas atsirasti naujoms inovatyvioms, nusistovėjusią tvarką griaunančioms įmonėms, įvairioms naujoms paslaugoms ir produktams. Įmonių ir net valstybių konkurencinis pranašumas vis labiau priklausys nuo sugebėjimo efektyviai panaudoti didžiuosius duomenis, o toliau tobulėjant technologijoms ir augant didžiųjų duomenų panaudojimo galimybėms, kompiuterizuoti sprendimai vis dažniau pakeis nerutinines žmogaus atliekamas veiklas.
Didieji mažmenininkai, tokie kaip interneto milžinė Amazon.com ar amerikiečių prekybos tinklai „Macy‘s“ bei „Mal-Mart“, savo veikloje jau plačiai naudoja didelės apimties duomenų analizę. Įmonės, siekdamos geriau suprasti klientų apsipirkimo įpročius, pateikti labiau jų poreikius atitinkančius pasiūlymus, reklamuoti produktus, informuoti apie akcijas, nuolat analizuoja klientų duomenis. Tai gali būti pirkimų istorija, informacija, talpinama vartotojų socialiniuose tinkluose bei gaunama per įvairius jutiklius, mobiliuosius įrenginius, išmaniuosius telefonus ar net vaizdo įrašus. Tokia duomenų analizė leidžia jiems didinti savo pardavimus ir įgyti konkurencinį pranašumą prieš kitas įmones.
Didelės apimties duomenų analizė ateityje vis daugiau pridėtinės vertės kurs ne tik įmonėms, bet ir visai visuomenei, kadangi leis tiksliau prognozuoti ir greičiau reaguoti į pasaulyje vykstančius įvykius, pavyzdžiui, įvairias epidemijas ar ekonomikos krizes. Jau dabar įrankis „Google Flu Trends“, agreguodamas žmonių paieškas apie gripą ir jo simptomus per Google paieškos sistemą, informuoja apie galimas gripo epidemijas keliomis savaitėmis anksčiau nei apie jas paskelbia oficialūs šaltiniai. Be to, jau kuriami modeliai, paremti didelės apimties duomenų analize, kurie leis stebėti ekonomikos raidą realiu laiku, daug tiksliau prognozuoti jos vystymąsi bei iš anksto numatyti recesijas.
Žvelgiant į Lietuvos verslą, kol kas panašu, kad šioje srityje jis sparčiai atsilieka. Tačiau akivaizdu, kad siekdamas išlikti konkurencingas globalioje rinkoje jis taip pat turės analizuoti ir „įdarbinti“ didelės apimties duomenis. Tai taikytina ne tik mažmeninės prekybos ar paslaugų įmonėms, parduodančioms produktus ar paslaugas tiesiogiai vartotojams, bet ir gamintojams. Pažangių daviklių ir kitų šaltinių generuojamų duomenų analizė pramonėje leistų pasiekti geresnės produkto kokybės, tiksliau aptikti defektus, optimizuoti veiklas bei resursų panaudojimą ir taip sumažinti gamybos sąnaudas. Pavyzdžiui, davikliai Ford Focus elektromobiliuose teikia gamintojui duomenis apie vairuotojų vairavimo įpročius bei informaciją apie tai, kur, kaip ir kada yra įkraunama automobilio baterija. Tai leidžia gamintojui padaryti vertingų įžvalgų apie savo klientus bei tobulinti produktą, o atsakingoms institucijoms lengviau priimti sprendimus dėl elektromobilių įkrovimo tinklo vystymo.
Vis dėlto, nepaisant išaugusio susidomėjimo didžiaisiais duomenimis kol kas pasaulyje panaudojama tik pusė procento visų duomenų – efektyviam jų išgavimui ir analizei vis dar trūksta instrumentų, žinių bei patirties. Ateityje pagrindinis iššūkis efektyviam šių duomenų panaudojimui bus įrankių bei modelių, kurie galėtų apdoroti ir analizuoti didelius nestruktūrizuotų, sparčiai augančių duomenų kiekius, sukūrimas. Ir panašu, jog judama tinkama kryptimi – rizikos kapitalo fondai intensyviai finansuoja startuolius, kurių veikla susijusi su didelės apimties duomenimis. Duomenų analizės sprendimus kuria ir jau veikiantys verslo gigantai, pavyzdžiui, IBM, Microsoft, kuriasi vis daugiau specializuotų įmonių, kurios teikia tokių duomenų analizės paslaugas.
Dar vienas iššūkis yra susijęs su augančiu vartotojų nerimu ir įtarumu dėl to, kaip įmonės naudoja su jais susijusią informaciją. Siekiant atskleisti pilną didžiųjų duomenų potencialą, bus būtina užtikrinti vartotojų pasitikėjimą įmonėmis ir programomis, naudojančioms didžiuosius duomenis. Ypatingas dėmesys turės būti skiriamas klausimams, susijusiems su asmeninių ir anoniminių duomenų naudojimu, teise būti „pamirštiems“ bei atsakomybe, tenkančia įmonėms, nesilaikančioms nustatytų taisyklių. Reguliuojančiųjų institucijų laukia tikrai nelengvas uždavinys, tačiau prie patikimos aplinkos kūrimo privalo prisidėti ir verslo atstovai, kurdami patikimų įmonių reputaciją. Ir vartotojai yra linkę dalintis asmeniniais duomenimis, jei jie mano, kad vertė, kurią jie už tai gauna, atitinka mokamą privatumo kainą.
(20)
(1)
(19)