Muutama video aiheesta

Ensimmäinen on otsikolla "Big Data for Tomorrow" viime huhtikuulta:

Ja toinen vaatimattomalla otsikolla "Big Data Analytics Is Changing the World -- and Your Business" O'Reillyn Strata Summitista syyskuussa 2011:

Big data-ratkaisuja

Yritysten big data-tarjoomat alkavat yhä selkeämmin hahmottua ja niitä löytyy kaikissa kokoluokissa. Yhteisenä nimittäjänä lähes kaikilla on Hadoop. Microsoft hahmottaa omaansa seuraavasti:

Vertailun vuoksi kokoluokassa toisesta ääripäästä löytyy esim. Pentaho, joka mainostaa olevansa:

Big data-demovideo ja AWS-esimerkki

Tässä lyhyt EMC:n demo big datan hyödyistä (power of big data)

ja toinen vähän pidempi "Amazon Web Services"+"Big Data" yhdistelmästä:

MapReduce Google App Engine

Vuonna 2008 julkistettu GAE on tullut ulos Preview-kaapista ja on nyt täysiverinen Google-tuote. SLA on 99,95 % ja ominaisuuksia lisätään jatkuvasti.

Tänään julkisestetussa 1.6.0-versiossa on mukana MapReduce, jota on pitkään lupailtukin.

MapReduce: We are releasing the full MapReduce framework in experimental for Python. The framework includes the Map, Shuffle, and Reduce phases.

Google BigQuery-palvelu

Google on julkistanut (jälleen) uuden palvelun: BigQueryn. Istuu samaan teemaan, mistä tässäkin blogissa on puhuttu: suurten datamäärien tallentamisen ja käsittelyn sekä pilvipalveluiden tarjoaman laskentakapasiteetin yhdistymiseen. Googlen sanoin BigQuery tarjoaa:

Google BigQuery Service is a web service that enables you to do interactive analysis of massively large datasets—up to billions of rows. Scalable and easy to use, BigQuery lets developers and businesses tap into powerful data analytics on demand.

Etuja Google kuvailee seuraavasti:

AWS HPC

Amazon julkisti eilen uuden instanssityypin HPC- eli High Performing Computing-sarjassa. Suoritustehoa saa hintaan 2.40$ / tunti eli kahvikupillisen hinnalla saa seuraavaa:

  • 88 EC2 Compute Units (Eight-core 2 x Intel Xeon)
  • 60.5 GB muistia
  • 3370 GB paikallista tallennustilaa
  • 10 Gigabit Ethernet

Mitä tehoilla sitten keksii tehdä on käyttäjästä kiinni. Lisää HPC:sta Amazonilla voit lukea täältä

Big datasta lukuina

Economist-lehti julkaisi videon, jossa esitellään big dataa lukuina ja visioidaan tulevaisuutta. Tiedon määrän kasvussa näkee hyvin tarpeen uusille työvälineille. Dataa oli, on ja tulee olemaan maailmassa seuraavasti:

Big Data, Cloudera, Hadoop ja AWS EC2

Cloudera tarjoaa avoimen lähdekoodin paketin nimeltä Cloudera's Distribution Including Apache Hadoop (CDH), joka on nyt versiossa kolme eli tarjolla on CDH3. Se sisältää seuraavat Hadoopin ja Hadoopin käyttöön läheisesti liittyvien projektien versiot:

Hortonworks Data Platform

Hortonworks on Yahoon spin-off-yritys, jonka se perusti kesällä 2011 yhdessä pääomasijoittaja Benchmark Capitalin kanssa. Hortonworks tarjoaa avoimen lähdekoodin alustaansa Hortonworks Data Platformia suurten datamäärien analysointiin ja sen perustana on tottakai Hadoop ja kumppaniprojektit

HDP:n ensimmäinen versio on testikäytössä ja julkaistaan vuoden 2012 alkupuoliskolla.

Teradata

Teradata on Aster Data Analytic Platformillaan ja muulla tarjonnallaan yksi Big Data-markkinoiden usein mainituista tarjokkaista. Äskettäin yrityksen toimitusjohtaja oli kertomassa näkemyksiään Tietoviikossa. Hadoop on kaikkien huulilla ja vaikka se on avoimen lähdekoodin projekti ja siten ilmaiseksi ladattavissa, on sen ympärille kasvamassa iso bisnes.

Teradatan nettisivuilla Big Dataa sivutaan monin tavoin ja sanoin. Tässä eräs Teradatan video Big Datasta:

IDOL

Nyt ei puhuta ohjelmaformaatista, vaan Autonomy IDOL 10:stä, josta HP:n ostama Autonomy julkisti tiedotteen eilen.