Saltmätargatan 8A, 113 59 Stockholm

+46 (0) 8 410 55 700 info@middlecon.se

EDW i Hadoop

Hadoop är ett spännande område med många möjligheter där det hela tiden händer något nytt. Att hålla lika steg med utvecklingen är inte alltid lätt. Visste du till exempel att Hortonworks har en paketering runt EDW? Det är väldigt intressant!

Förvisso kan jag tycka att det är lite trist är att Hortonworks har valt att göra detta med två komponenter (Syncsort och AtScale) som inte är Open Source men det finns alternativ som är motsvarande. Jag tänker då framförallt på Kylin eller Hawq och Pentaho Kettle.

Middlecon deltar i ett stort big data projekt inom fordonsindustrin just nu. Där arbetar jag med Kylin och kommer att titta på Kettle framöver. Kylin är förvisso tidigt i utvecklingsfasen, men med rätt typ av data och rätt typ av frågor så kan jag ställa analytiska frågor på tabeller med 5,3 miljarder rader, och få svar tillbaka på ca 0,5 sekunder. Riktigt imponerande!

För den som är nyfiken på mera detaljer finns en jättebra artikel. Jag rekommenderar verkligen några minuters läsning.

Länk till Hortonworks