Wat wordt er verstaan onder data analyse?
Data analyse is een proces waarbij je gegevens onderzoekt, opschoont en eventueel hergebruikt, waarbij je de meest waardevolle informatie bewaart, analyseert en documenteert. Deze gegevensanalyse wordt ook wel data modellering genoemd en kan middels diverse data analyse tools worden geanalyseerd. Er zijn dus verschillende tools en (onderzoeks-) methoden om dit uit te voeren. Eerst maken we een onderscheid tussen kwalitatief en kwantitatief onderzoek. Bij het doen van een onderzoek rondom data analyse draait het om het verzamelen van zoveel mogelijk nuttige informatie.
Maar de wijze om tot die informatie te komen kan nogal verschillen. Belangijk is dat je geen aannames doet en geheel onafhankelijk naar gegevens kijkt. Met bepaalde voorkennis kan je een vraag soms al beantwoorden wat natuurlijk afbreuk doet aan de kwaliteit van het onderzoek. Je wilt namelijk voorkomen dat je foute conslusies trekt. Wanneer je kwalitatief onderzoek uitvoert bekijk je dus alle gegevens die maar een bijdrage kunnen leveren aan een onderzoeksvraag. Maar wanneer je kwantitatief onderzoek uitvoert ga je juist bepaalde variabelen analyseren. Vaak door antwoorden vanuit gesloten vragen te verwerken in tabellen en grafieken.
Het belang en proces van data analyse
Gegevens verzamelen is een belangrijke eerste stap. Door het analyseren van deze gegevens en het omzetten naar modellen kun je relaties, patronen en trends vaststellen en evalueren. Daaraan kunnen vervolgens conclusies worden verbonden die bijdragen tot een zorgvuldiger besluitvormingsproces. Bijvoorbeeld om meer inkomsten te genereren, kosten te besparen, efficienter te werken, de klanttevredenheid te verhogen, risico’s te beperken, etc.
Maar hoe ziet het proces er nou precies uit? We kunnen diverse stappen onderscheiden in het proces van data analyse.
1. Bepalen van de onderzoeksvragen en de input (vereiste gegevens)
2. Verzamelen van gegevens uit databases, interviews, (online) bronnen, etc.
3. Verwerking van gegevens en het ordenen hiervan
4. Het verwijderen en corrigeren van gegevens (duplicate content, onvolledige gegevens aanvullen)
5. Exploratieve data analyse (ruwe data analyse) om te kijken of er voldoende gegevens beschikbaar zijn om de onderzoeksvraag (of vragen) te beantwoorden
6. Opsporen van verbanden en toepassen van algoritmen om variabelen te onderzoeken (vaak middels wiskundige modellen of formules)
7. Input omzetten naar bruikbare informatie (desgewenst ook applicaties / systemen / dashboards ontwikkelen / aanpassen)
8. Rapporteren en informeren van gebruikers

Meest gebruikte data analyse methoden
Er bestaan dus diverse data analyses tools om allerlei gegevens te analyseren. Alle nuttige data die bedrijven verzamelen worden geanalyseerd door data analisten. Zij visualiseren gegevens met behulp van data visualisatie tools waarbij rapportages opgeleverd worden in de vorm van overzichtelijke dashboards. Meestal is dit een onderbouwing van gegevens aan de hand van grafieken en tabellen. Hieronder beschrijven we de meest populaire en gebruikte data analyse methoden.
Business Intelligence (BI)
Men maakt gebruik van software om ruwe data om te zetten in bruikbare informatie. Het kan bestaan uit rapportagefunctionaliteit, tools, ondersteuning voor datamining-technieken en predictive analysis.
Rapportages
Men gebruikt allerlei rapportages om bruikbare informatie boven tafel te krijgen.
OLAP
Dit is een computergestuurd proces waarbij men gegevens verzamelt en analyseert. OLAP gebruikt complexe berekeningen, analyses en data-modelling met als doel om bijvoorbeeld budgetten te bepalen of voorspellingen te doen.
Datamining
Men sorteert een chaos aan gegevens, onderzoekt en categoriseerd deze om onregelmatigheden en patronen te herkennen. Rekening houdend met bedrijfsinformatie, relevante nieuwsbronnen en wet- en regelgeving.
Predictive analytics
Dit zijn geavanceerde analyses om voorspellingen te doen over toekomstige situaties aan de hand van feiten en cijfers.
Machine learning
Dan hebben we het over algoritmen en wiskundige modellen.