Big Data -hype on koko ajan enemmän ja enemmän esillä, ja osa onkin jo täysin kyllästynyt koko termiin. Itse en ole niinkään turhautunut termiin, vaan enemmänkin siihen, miten tätä ilmiötä lähestytään. Tapaan omassa roolissani viikoittain yritysten päättäjiä Big Data -tarpeisiin liittyen. Näissä keskusteluissa olen huomannut, että Big Datan mahdollisuudet nähdään aivan liian usein ainoastaan teknisenä haasteena. Vielä pahempaa on se, kun Big Datan tekninen kyvykkyys halutaan tuoda organisaatioon ”väkisin” vain sen takia, että siitä on nyt eniten kohinaa maailmalla. 

Olen jo useamman kerran kuullut asiakkailta sanat: ”Me halutaan Big Data, me halutaan Hadoop” tai ”Me halutaan sama ratkaisu, mikä jollain toisellakin toimijalla on käytössä”. Nämä ovat kumpikin jo lähtökohtaisesti täysin vääriä tapoja lähestyä Big Dataa ja sen luomia mahdollisuuksia omalle organisaatiolle. 

Edelleen vallitsee myös vahvasti se harhakäsitys, että Big Datassa olisi kysymys vain valtavista tietomääristä (Volume). Tämäkin toki pitää ajoittain paikkansa, mutta melkein suurempi merkitys on sillä, että tieto on usein monimuotoista (Variety), eikä sitä pystytä tehokkaasti hallinnoimaan perinteisten relaatiokantojen avulla, tai että tietoa tarvitaan reaaliajassa (Velocity) liiketoiminnan käyttöön. 

Big Datan suhteen tekniset asiat ovat varsin triviaaleja verrattuna siihen työhön, jota tulisi tehdä, ennen kuin edes lähdetään miettimään teknistä ratkaisua. Tarkoitan tällä sitä työtä, jossa mietitään mitä lisäarvoa voimme Big Datan avulla tuottaa, ja miten voimme hyödyntää sitä luodaksemme kilpailuetua markkinoilla. Käytännössä työn tulisi lähteä liikkeelle oman liiketoiminnan parantamiseen tähtäävien käyttötapauksien suunnittelun kautta. Tässä ei ikävä kyllä auta tieto siitä, että kilpailijalla on käytössä esimerkiksi Hadoop tai joku muu hieno Big Data -teknologia.

Käyttötapauksia voi olla monenlaisia, ja ne voivat erota toimialojen mukaan. Teollisuusalalla kiinnostavia käyttökohteita voivat olla vaikkapa laitteiden suorituskyvyn optimointi, huolto- tai vikatilanteiden ennustaminen tai kolmannen osapuolen datan hyödyntäminen (mm. paikka- ja säätieto). Kauppa- ja media-alalla taas esimerkiksi tapahtuma- ja käyttäjäperusteinen suosittelu, mainonnan kohdentaminen, asiakaspoistuman ennakointi ja asiakkaiden segmentointi voivat olla kiinnostavia. Erilaisia esimerkkejä voisi esittää lähes loputtomiin eri toimialoille ja Siilissä olemmekin ratkoneet monenlaisia käyttötapauksia suomalaisille asiakkaille.  

Käyttötapausten kautta tullaan toisen tärkeän kysymyksen äärelle; tarvitaanko tieto reaaliajassa liiketoiminnan käyttöön (Online) vai onko tieto sellaista, jota tarvitaan kenties seuraavaksi aamuksi tai muutaman tunnin aikajänteellä päätöksenteon tueksi (Offline). Tällä on suuri merkitys siihen, millainen Big Data -arkkitehtuuri ja mahdollinen ratkaisu valitaan, sillä tietyillä teknologioilla on hyvät kyvykkyydet käsitellä suurta määrää tietoa, mutta ne eivät välttämättä sovellu reaaliaikaisen tiedon tuottamiseen, kun osa taas tukee erityisen hyvin monimuotoista ja reaaliaikaista tiedon hyödyntämistä.  

Huvittavaa on sinällään se, että samanlaisista käyttökohteista, tarpeista ja haasteista on puhuttu jo vuosia analytiikan ja tiedonlouhinnan saralla, mutta nyt uusien Big Data –kyvykkyyksien tuomien kustannusetujen myötä ratkaisujen toteuttaminen ei ole enää ainoastaan suurimpien yhtiöiden yksinoikeus. Myös pienemmät toimijat pystyvät toteuttamaan innovatiivisia ja markkinoita mullistavia ratkaisuja. Jos ollaan realistisia, tästä junasta ei voi jäädä pois, mikäli halutaan pysyä kilpailussa mukana, ja mikä tärkeintä, luoda kilpailuetua muihin nähden. 

Kuten mainittua, ennen kuin hyökkäämme uusien hypetettyjen Big Data -teknologioiden kimppuun, on järkevää miettiä, mitä oikeasti halutaan saavuttaa ja suunnitella sen perusteella soveltuvin Big Data -arkkitehtuuri ja -ratkaisu taklaamaan nämä tarpeet. On myös tärkeää muistaa, että ei yritetä syödä koko elefanttia kerralla, vaan lähdetään ketterästi ratkomaan ensin muutamaa tärkeintä käyttökohdetta, ja haetaan tällä tavoin onnistumisia ja lisäarvoa liiketoiminnalle. Pienten voittojen avulla nostetaan organisaation maturiteettia Big Datan hyödyntämisen saralla ja uskalletaan lähteä seuraavaksi entistä haastavampien ratkaisujen kimppuun.  

Kilpailuetu luodaan innovatiivisten käyttötapausten ja niitä tukevien arkkitehtuuriratkaisujen kautta, ei pelkästään teknologian avulla.

Jere Helenius

Jere toimii Siilillä Informaationhallinnan heimonvetäjänä sekä Big Data -arkkitehtinä. Jeren intohimona on datan muuntaminen tiedoksi ja ymmärrykseksi, jotta sitä voidaan hyödyntää liiketoiminnan tarpeisiin. Tavoitteena on auttaa asiakkaita löytämään innovativiisia käyttökohteita Big Datalle, suunnittelemaan niitä tukevia arkkitehtuuriratkaisuja sekä viemään tiedon osaksi päätöksentekoa uusien datan visualisointiratkaisujen avulla.

Siili Solutions Oyj
Siili Solutions Oyj on suomalainen tietojärjestelmien kehityspalveluita tarjoava yhtiö, joka tuottaa koko tietojärjestelmän kattavia IT-asiantuntijapalveluita julkishallinnolle, pankeille, mediatoimialalle ja teollisuudelle. Siili on kasvanut nopeasti ja kannattavasti perustamisestaan vuodesta 2005 lähtien.

Leave a comment

Filtered HTML

  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Sallitut HTML-tagit: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Rivit ja kappaleet päätetään automaattisesti.

Plain text

  • No HTML tags allowed.
  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Rivit ja kappaleet päätetään automaattisesti.
Roskapostitorjuntaa.