De afgelopen paar jaar is het aantal platforms voor big data analyse enorm toegenomen. Het veelgebruikte Hadoop framework is erg populair voor big data, maar ook enorm technisch en om het framework echt te kunnen gebruiken heb je een platform nodig om alles vanaf te kunnen beheren.
Dit soort platorms zijn betaalde diensten die je praktische tools en diensten bieden om je data te kunnen analyseren. Big data en analytics expert Bernard Marr schreef daarom voor SmartData Collective over 10 big data analytics platforms die je moet kennen.
Cloudera is opgezet door voormalige werknemers van Google, Yahoo, Facebook en Oracle en biedt zowel open source als commerciele op Hadoop gebaseerde big data oplossingen aan met het label Cloudera Distribution including Hadoop, kortweg CDH. Hun distributie maakt gebruik van hun Impala analytics engine welke inmiddels ook gebruikt wordt door concurrenten zoals Amazon en MapR.
Als enige big analytics platform bestaat HDP volledig uit open source code, waarvan alle elementen gebouwd zijn via de Apache Software Foundation. Ze verdienen hun geld door diensten en ondersteuning aan te bieden om het op te zetten en de resultaten te krijgen waar je naar op zoek bent.
Microsoft’s vlaggenschip als het gaat om data-analyse, HDInsight, is gebaseerd op Hortonworks Data Platform, maar aangepast om optimaal te functioneren met hun eigen Azure cloud services en SQL Server database management system. Een groot voordeel voor bedrijven is dat het goed integreert met Excel, wat betekent dat zelfs medewerkers met slechts een basiskennis van ICT met big data analytics kunnen spelen.
IBM biedt een variatie aan producten en diensten aan om complexe big data analyses meer toegankelijk te maken voor bedrijven. Ze bieden hun eigen Hadoop distributieplatform aan onder de naam InfoSphere BigInsights.
Dit platform richt zich specifiek op ondernemingen die een boel eigen data genereren met hun eigen machines. Hun doelstelling is ‘van machine data naar operationele intelligentie’. Internet of Things is een sleutelonderdeel van hun strategie, en ze doen ondermeer de analytics achter de Nest wifi-smart thermostaat en Domino’s Pizza’s Amerikaanse coupon campagnes.
Wat is Internet of Things?
Internet of Things is het idee van een netwerk van ‘dingen’ met elektronische sensors die gegevens naar ‘het internet’ kunnen sturen. Je kunt hier bijvoorbeeld denken aan slimme thermostaten, pacemakers of gechipte dieren.
Hoewel iedereen bij Amazon vooral denkt aan de webwinkel, verdienen ze ook hun geld door hun magische businessmodel te verkopen aan anderen bedrijven. Het businessmodel was vanaf het begin al gebaseerd op big data: het gebruiken van persoonlijke informatie om een gepersonaliseerde winkelervaring te bieden. Amazon Web Services biedt ondermeer Elastic Cloud Compute en Elastic MapReduce diensten voor data-opslag en -analyse op grote schaal in de cloud.
Pivotal’s big data pakket bestaat uit hun eigen Hadoop distributie, Pivotal HD en hun analytics platform Pivotal Analytics. Hun businessmodel geeft klanten de mogelijkheid om een ongelimiteerde data op te slaan en een abonnement dat gebaseerd is op hoeveel data ze analyseren. Het bedrijf staat volledig achter de filosofie van een ‘data-meer’, een centrale opslagplaats voor alle data van een organisatie.
Infobright is nog een database management system dat een open source, gratis versie en betaalde versie heeft. Dit product richt zich op gebruikers die met Internet of Things aan de slag willen. Ze bieden drie niveaus van service voor betalende gebruikers, met meer en snellere toegang tot de helpdesk.
MapR biedt met het MapR Data Platform hun eigen distributie van Hadoop aan, welke volgens MapR betere prestaties beloofd en meer gebruiksgemak.
Zoals veel van de andere systemen hier, gebruik dit platform data van je Hadoop of cloud-based storage network en geeft het gebruikers toegang tot een reeks aan geavanceerder analytische functies. Kognitio wordt ondermeer gebruikt door BritishTelecom om hun beltarieven te bepalen en hun spaarprogramma Nectar te analyseren.