Big data-lukuja

McKinseyn toukokuussa julkaisema Big data-raportti lupailee satojen miljardien säästöjä ja hyötyjä, jos massiiviset datamäärät saadaan tehokkaaseen käyttöön. Lue lyhennelmä täältä, mistä löytyy myös linkki koko raporttiin.

1.8 zettabittiä dataa...

IDC:n mukaan maailmassa luodaan vuonna 2011 arviolta 1.8 zettabittiä dataa. Oli tarkkaa tai ei, niin kuulostaa paljolta (kunhan ensin googlettaa montako nollaa on zettabitissä...). Täältä voi lukea lisää.

Big data Gartnerin hypekäyrällä

Cloud computing istuu uuden hypekäyrän huipulla ja big data on nousukiidossa. Juttu aiheesta täällä.

Unohda Hadoop

LexisNexis julkisti HPCC:n, avoimen lähdekoodin kilpailijan Hadoopille. Mainoslause on: HPCC: The Fastest Most Powerful Way To Solve Big Data Problems.

Wal-Mart ja big data

Wal-Mart käyttää Hadoopia analysoidakseen Twitter-, Facebook- yms. dataa. Lue artikkeli täältä.

Big datalla ennustuksia tulevaisuudesta

BBC:n jutussa kerrotaan, miten analysoimalla miljoonia uutisartikkeleita, voidaan vetää johtopäätöksiä, mitä tulee tapahtumaan.

Big data-linkkejä

Mikko Muurinen on kerännyt blogiinsa listan ajankohtaisia big dataan liittyviä linkkejä. Linkit sisältävä kirjoitus löytyy täältä ja hyvä big data-käsitteen esittely täältä.

IBM, Oracle ja Microsoft mukana big data hypessä

Vai onko kyseessä hype - aika näyttää. Markkinoinnissa näkyvyyttä käsitteen ympärille kuitenkin rakennetaan ahkerasti:

Oraclen blogia lainatakseni: Big data platform eli vapaasti suomennettuna tiedonlouhintajärjestelmä on keskeinen osa yrityksen IT infrastuktuuria lähitulevaisuudessa.

Big data-koulutus

Kiinnostava käsite herättää aina tarpeen koulutuksille sekä seminaareille, mutta yllättävän vähän käsitettä käytetään markkinoinnissa ainakaan pikaisen googlettamisen perusteella:

Google Maps ja SAP Business Analytics

Googlen ja SAP:n yhteistyötä:

Google Maps ja SAP Business Analytics

Lisää SAP Business Analytiikkaan liittyviä uutisia täällä.

Haluatko tietää lisää Hadoopista?

27.09.2011 alkaa Clouderan ja Informatican yhteistyössä järjestämä 7-osainen webinaarien sarja Hadoopista. Ilmoittautuminen täällä.

Culturomics

Voiko konflikteja, talouskriisejä yms. ennustaa analysoimalla uutisia? Supertietokone Nautilukseen syötettiin yli 100 miljoonaa uutista ja saatiin mielenkiintoisia tuloksia. Lue lisää aiheestä täältä

Tietovaraston mallinnus ja rakentaminen

1.-2.12.2011 järjestetään "Tietovaraston mallinnus ja rakentaminen"-koulutus Helsingissä Taitotalolla.

Lue lisää ja ilmoittaudu

Big data-määritelmä

Monisanainen, mutta osuva tai ainakin paljon lainattu:

Suurten datamäärien analysointi: Google App Engine

Google App Engine on Googlen vuonna 2008 julkistama pilvipalvelu (PaaS, Platform-as-a-Service), joka toimii alustana Python-, Java- ja Go-ohjelmointikielillä toteutetuille sovelluksille. Infrastruktuuri on sama, mitä Google itse käyttää, joten skaalautuvuus ei ole ongelma. Tässä video App Enginen käytöstä suurten datamäärien analysoinnissa:

Hadoopin esittelyvideo

Hadoop on yksi yleisimmistä tuotenimistä joita esiintyy, kun puhutaan big datasta. Tässä lyhyt esittely siitä, mikä on Hadoop ja kuka sitä käyttää:

O'Reilly Hadoop

Open source business ingelligence

Avoimen lähdekoodin BI-järjestelmä Pentaho lupaa tehdä Hadoopin käytöstä helpompaa ja nopeampaa. Tarjolla on monta eri versiota: yksi GPL lisensoitu ja maksuton sekä kolme maksullista, lisäominaisuuksia sisältävää.

Pentaho tulee myös mainituksi tuoreessa Tietoviikon artikkelissa aiheesta.