Viime aikoina meitä kaikkia IT –alalla toimijoita on paljon puhuttaneet termit kuten Bigdata, Smalldata, Fast data ja Data in Motion. Näitä varmaan osaavat eri asiantuntijat luetella erinäisen määrän samalla tavalla kuin BigDatan V-sanojakin. Kaikki ovat myös kiinnostuneet siitä mihin tätä uutta teknologiaa oikein voitaisiin hyödyntää käytännön elämässä.

Kyse on kuitenkin aina pohjimmiltaan samasta asiasta ; jossain syntyy dataa, sitä halutaan käsitellä ja mahdollisesti tallentaa myöhempää hyödyntämistä varten. Data tallennetaan joko ihan sellaisenaan raakadatana tai sitten mahdollisesti jollain tapaa puhdistettuna ja jalostettuna. Nykypäivän termein siis ”hadooppiin” tai ”tietovarastoon”. Teknisesti tässä tietysti on selkeä ero, mutta bisneskäyttäjän ei kuitenkaan ehkä tulisi joutua välittämään siitä missä data on? Hänelle on tärkeää tietää mitä dataa on saatavilla, minkä laatuista se on ja tietenkin … saada data haluamallaan välineellä.

Meidän onkin mielestäni aika alkaa miettimään tiedonhallintaa ja tiedon integraatiota myös kokonaisvaltaisemmin, eikä pelkästään joko BigData- tai tietovarastonäkökulmasta. BigDatan myötä syntyneitä teknologioita voidaan hyödyntää myös ihan perinteisten haasteiden ratkaisemiseen, kyse ei tarvitse aina olla Twitterin tai Facebookin analysointi. Esimerkiksi asiakastietojen ajantasainen integrointi eri järjestelmistä yhteen voikin olla paljon helpompaa NoSQL -maailmassa kuin perinteisen relaatiomallin keinoin.

Alalle onkin jo syntynyt konsepteja kuten ”Data Hub”, ”Data Lake” tai ”Logical Datawarehouse”, joille kaikille on yhteistä se että ne pyrkivät tarjoamaan kokonaisarkkitehtuurin, jossa uudet ja vanhat teknologiat ja ratkaisumallit ovat luonnollisilla paikoillaan ja loppukäyttäjien ei tarvitse välittää niin paljon siitä missä data oikeasti makaa. Data tulee virtualisoitumaan samantyyppisesti kuin pilvi virtualisoi palvelimet. Esimerkiksi DBA-rooleihin tällä tulee olemaan vaikutusta ja tärkeäksi asiaksi nousee tiedon määritelmien ja metadatan hallinta.

Toistaiseksi nämä mallit ovat enemmän joko yksittäisten toimijoiden konsepteja tai analyytikkofirmojen visioita, mutta on selkeästi nähtävissä että tähän suuntaan maailma on menossa. Käytännössä kaikki tietokantojen teknologiatoimittajat ovat sisällyttäneet tai integroineet Hadoopin jotenkin tuotteisiinsa. Muutokseen kannattaa alkaa jo varautumaan sillä kohta elefantti on sinunkin konehuoneessasi.

Petri Reiman

Teknologiajohtaja, Affecto

Affecto
Affecto on tiedolla johtamisen ratkaisuihin erikoistunut yritys.
Avainsana: 

Leave a comment

Filtered HTML

  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Sallitut HTML-tagit: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Rivit ja kappaleet päätetään automaattisesti.

Plain text

  • No HTML tags allowed.
  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Rivit ja kappaleet päätetään automaattisesti.
Roskapostitorjuntaa.