Autorius: Julius Belickas, Mantas Zimnickas
Duomenų atvėrimo pagal poreikį proceso scenarijaus įgyvendinimas
Vertinant tai, kad nacionaliniai ištekliai visuomet yra riboti, būtina siekti racionalaus valstybės turimų informacinių išteklių atvėrimo proceso, t. y. vykdyti investicijas ir atverti tik tuos duomenis, kurie bus užtikrintai paklausūs ir iš karto panaudojami svarios pridėtinės vertės kūrimui.
Atsižvelgiant į tai, Informacinės visuomenės plėtros komitetas (toliau – IVPK) siūlo naudoti vieningą ir optimizuotą duomenų atvėrimo procesą ir jo įgyvendinimui jau sukūrė bei įdiegė pilną komplektą specialių duomenų atvėrimo įrankių, leidžiančių atverti duomenis pagal konkrečius atvirų duomenų naudotojų poreikius. Sukurti įrankiai yra skirti duomenis atveriančių institucijų darbuotojams ir pateikti Lietuvos Atvirų duomenų portale.
Įgyvendinant šį duomenų atvėrimo procesą pirmiausia reikėjo atsakyti į esminius klausimus:
- Ar valstybė žino, kokių duomenų reikia vartotojams?
- Ar vartotojai žino, kokių duomenų gali tikėtis?
- Ar vartotojai gali lengvai ir paprastai išsakyti poreikį, kokių duomenų jiems reikia iš „valstybės atvirų duomenų meniu“?
- Ar pati valstybė žino, kokius duomenis turi ir gali atverti valstybės mastu?
- Ir galiausiai – ar valstybė turi IT priemones ir infrastruktūrą, leidžiančias patogiai ir efektyviai atverti duomenis?
Pabandžius atsakyti į iškeltus klausimus ir objektyviai įvertinus galimas sprendimų įgyvendinimo alternatyvas tapo akivaizdu, kad potencialiems duomenų vartotojams patogiausia poreikį išreikšti patiems pažymint reikalingus duomenis viešai paskelbtame „Valstybės atvirų duomenų meniu“ – galimų atverti duomenų sąraše. Taigi pirmu ir svarbiausiu duomenų atvėrimo proceso uždaviniu tapo poreikis suinventorinti valstybės sukauptus duomenis ir paskelbti vartotojui galimų atverti duomenų rinkinių metaduomenis viešai.
Deja, iki šiol valstybėje tokia detali sisteminė sukauptų duomenų apskaita nebuvo vykdoma, taip pat nebuvo ir tam tinkamų priemonių. Tad į Lietuvos atvirų duomenų portalo (https://data.gov.lt) funkcionalumą teko įtraukti inventorinimo aplinkos sukūrimą bei atitinkamus technologinius įrankius. Šie įrankiai įgalino automatizuotai nuskaityti valstybės informacinės sistemos ar registro duomenų bazės (pirminio šaltinio) struktūrą ir jos pagrindu parengti atvirų duomenų rinkinio struktūros aprašą (ADSA) kaip svarbiausią inventorinimo proceso rezultatą.
Kyla klausimas, kokia yra iš to nauda vartotojui? Minėtu įrankiu parengus ADSA ir jį pateikus Lietuvos atvirų duomenų portale, duomenų vartotojui suteikiamas „duomenų meniu“, iš kurio jis gali pasirinkti duomenis, reikalingus konkrečių jo sprendimų priėmimui, problemų sprendimui ar projektų įgyvendinimui.
Taigi, Lietuvos atvirų duomenų portalas vartotojams suteikia aplinką, kurioje jie gali deklaruoti duomenų poreikį, nurodydami ADSA išvardintus laukus arba/ir aprašydami papildomą atvirų duomenų poreikį, kuris portale dar nėra tenkinamas. Tokiu būdu užsakytų ir galimų duomenų atvėrimas įvykdomas automatiškai, panaudojant kitą sukurtą įrankį – „Spinta“. T. y. duomenys iš pirminio duomenų šaltinio perkeliami į atvirų duomenų saugyklą, o pastaroji teikia duomenis per vieningą API įvairiais formatais.
Džiaugiamės, kad į pradžioje iškeltą klausimą dabar jau galime atsakyti – TAIP, duomenų atvėrimas pagal poreikį yra galimas. Kartu galime pasakyti, kad turime ką pasiūlyti tiek duomenų vartotojams, tiek duomenų teikėjams.
Pateikiame pilną sukurtų duomenų atvėrimo infrastruktūros įrankių sąrašą:
- informacinės sistemos/registro (SQL tipo) kaip pirminio atvirų duomenų šaltinio duomenų inventorinimui (laukų struktūros automatizuotam nuskaitymui ir struktūros failo sugeneravimui) įrankis;
- konfidencialios informacijos ir laukų su asmens duomenimis išeliminavimui ir atvirų duomenų struktūros aprašo parengimui įrankis;
- šaltinio duomenų automatiniam konvertavimui iš pirminio šaltinio į saugyklą (ETL agentą) įrankis;
- Lietuvos atvirų duomenų portalo aplinka vartotojo poreikio deklaravimui ir įgyvendinimo stebėsenai.
Taip pat atkreipiame dėmesį į tai, kad šie įdiegti inovatyvūs sprendimai ne tik turės tiesioginę naudą atvirų duomenų vartotojams, bet ir politikos formuotojams suteiks vertingą, tikslią, pamatuojamą bei nuolat atnaujinamą informaciją apie kaupiamus valstybės atvirų duomenų išteklius.