Hadoop-ekosysteemi kasvaa ja kehittyy vauhdilla. Uusien julkistusten tahti ei ainakaan ole hidastunut tänä vuonna. Käyttäjäkunnan kasvaessa kasvavat ja monipuolistuvat myös tarpeet. Datan tallennuksen ja käsittelyn muodot ovat valovuosien päässä alkuvaiheen HDFS+MapReduce -mallista. Yksi uusista julkistuksista on Kudu.

The set of data storage and processing technologies that define the Apache Hadoop ecosystem are expansive and ever-improving, covering a very diverse set of customer use cases used in mission-critical enterprise applications.

...

Data stored in Kudu is updateable through the use of a variation of log-structured storage in which updates, inserts, and deletes are temporarily buffered in memory before being merged into persistent columnar storage. Kudu protects against spikes in query latency generally associated with such architectures through constantly performing small maintenance operations such as compactions so that large maintenance operations are never necessary.

Hadoop ja Kudu

Lue lisää Clouderan blogista

Hadoopin näkökulmasta kehityskulku tarkoittaa sitä, että yhä harvemmassa ovat ne skenaariot, joihin Hadoop ei sovi.

Leave a comment

Filtered HTML

  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Sallitut HTML-tagit: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Rivit ja kappaleet päätetään automaattisesti.

Plain text

  • No HTML tags allowed.
  • Www-osoitteet ja email-osoitteet muutetaan automaattisesti linkeiksi.
  • Rivit ja kappaleet päätetään automaattisesti.
Roskapostitorjuntaa.