Big data koulutuksesta

Techrepublicissa pohditaan, mitä olisi syytä ottaa huomioon, kun valitaan koulutuskumppania big data -osaamisen lisäämiseen.

Here are some tips for choosing a Big Data training provider:

Ulkoinen big data

Big datan yhteydessä (tai datan ylipäänsä) puhutaan paljon datan lähteistä ja karkea tapa jakaa lähteet on kategorisoida ne ulkoisiin ja sisäisiin lähteisiin. Suurempi huomio keskittyy usein sisäisiin lähteisiin eli organisaation itsensä tuottamaan ja hallitsemaan dataan. Hyötynäkökulmasta ulkoiset datalähteet ovat kuitenkin suuremman arvopotentiaalin sisältäviä, mistä kirjoitetaan mm. Forbesin blogissa:

Viisi asiaa, jotka CIO:n pitää tietää

Uusimmassa "Global Intelligence for the CIO"-lehdessä listattiin asioita, joita CIO:n tulisi tänä päivänä "tietää" tai ainakin seurata. Lista ei ole yllättävä ja sisältää tottakai sekä pilvipalvelut että big datan:

Big dataa pilvessä: Amazon Redshift

Pilvipalvelujätiltä Amazonilta tulee tiuhaan uusia julkistuksia ja tässä yksi, jota ei tässä blogissa ole vielä mainittu: Redshift. Amazon Web Service -kokonaisuutta ja sen palvelukirjoa on esitelty paljonkin ja Redshift tallaa polkua big datan pilveensiirtämisen helpottamiseksi yhä helppokulkuisemmaksi.

With a few clicks in the AWS Management Console, you can launch a Redshift cluster, starting with a few hundred gigabytes of data and scaling to a petabyte or more, for under $1,000 per terabyte per year.

Hadoop-markkinoista

Cloudera sai lisärahoitusta 65 milj.$, mikä nosti kokonaispääomapanostuksen jo 140 milj.$ kokonaissummaan. Yrityksen arvoksi arvioidaan jo 700 milj.$. Melkoinen kasvutarina, kun muistaa, että Hadoop ylipäänsä julkistettiin vasta 2006.

 

38 faktaa big datasta

Tässä kattava listaus paljon siteerattuja lukuja big datasta. Useissa mainittu lähdekin, joten hyvä linkkilista lisälukemiseen.

Big data Fujitsun asiakaslehdessä

Tässä Fujitsun asiakaslehdessä juttu otsikolla "Big data - tiedonsirpaleista arvokkaita vastauksia".

Digitaalisen datan kasvusta ei ole epäilystä, mutta yllätyksenä tulevat edelleen tilanteet ja muodot, joissa uutta dataa syntyy ja sitä kerätään. Vielä enemmän yllättää, kun tutusta tiedosta kaivetaan esille aiemmin tuntematonta. Ja joko osaat arvioida, miten suuri on digitaalinen varjosi?

Big data -rummutus jatkuu

Vuosi 2012 lähenee loppuaan, mutta big data -rummutus vain kiihtyy. Vuodesta 2013 tullee big datan läpimurtovuosi konkreettisten projektien muodossa. Pilvipalveluiden kohdalla herääminen on tapahtunut viimeistään tänä vuonna ja skeptikot ovat vähemmistössä. Big datan kohdalla tarina tuntuu etenevän samalla tavoin: kuriositeetista valtavirtaan ja yleisen tason esityksistä konkreettisiin toteutuksiin.

Big data ennusteita

Tuore ennuste datan määrästä maailmassa löytyy mm. Tietokone-lehden sivuilta: vuoteen 2020 mennessä maailmassa tuotettu digitaalisen tiedon (datan) määrä nousee 40 tsettatavuun. Ennusteet siis vain kovenevat. Tässä taustalla EMC ja haastateltavana Tietokoneella oli Jussi Lehtinen, joka on esiintynyt tiuhaan big datan tiimoilta.

Big data ja kolmas teollinen vallankumous

Suunnilleen tällä otsikolla kirjoittaa Talouselämän blogissa big datasta Tiedon Joni Lehtonen. Mielikuvakamppailu big data -huomiosta käy kiivaana.

Microsoft Polybase

Miten olisi molemmat, sanoo Microsoft Polybase-vaihtoehdollaan.

Hadoop ja Cloudera Impala

Apache Hadoop projektista tuli joulukuun alussa ulos versio 1.1.1, jossa ei mitään mullistavaa uutta. Kiinnostava sivujuonne Hadoop-ekosysteemissä on Cloudera Impala, josta tässäkin blogissa kirjoitettu jo muutamankin kerran. Tässä tuore katsaus Impalan kehitykseen ja tulevaisuuteen. Mielenkiintoinen projekti, kannattaa seurata!

Osaajapula häämöttää big data -markkinoilla

Moni on sitä ennustanut ja kohta se lienee totta: pula big data -osaajista. Määritelmällinen epämääräisyys tekee ennustuksesta sumean, mutta suunta on oikea. Kun projektit lähtevät lähivuosina liikkeelle, ei Hadoop-osaajia tai muitakaan big data -taitajia ole helppo löytää. Näin ennustaa mm. Tietoviikko:

”Osaajien kysyntä on erittäin suurta, kun taas tarjonta on vähäistä..

Data on mahdollisuus

Monesti näkee vieläkin kirjoitettavan suurista datamääristä sävyyn, joka esittää datan ongelmana, johon tarvitaan ratkaisu. Näkökulma on väärä. Data on mahdollisuus, johon kannattaa tarttua. Tuore esimerkki datan haalimisesta on Oraclen ostama Dataraker, jolla on asennettuna yli 17 miljoonaa sensoria ympäri maailmaa. Näiden tuottamasta datasta voidaan jalostaa informaatiota, jolla on arvoa.