De term Big data lees je tegenwoordig overal, Big data is sexy.

Maar wat is big data precies?
Jammer genoeg is er geen consensus over wat ”big data” nu precies inhoudt.
Big data moet echter digitaal zijn en bestaat uit: foto’s (Instagram), videofilmpjes (Youtube), audio fragmenten (Spotify), tekst en cijfers (Twitter, Facebook en websites).
Sommigen scharen alle data die niet meer op één pc of in één Excelsheet passen onder Big Data. Weer anderen vinden dat data pas Big worden als je meerdere servers nodig hebt om de data op te slaan en te analyseren.

Big data: oude wijn in nieuwe zakken?
Grote bedrijven en universiteiten hebben altijd al veel data verzameld. Walmart begon in de jaren negentig al met het verwerken en analyseren van 7 miljard transacties per jaar. Oliemaatschappijen als Shell en Mobil Oil gebruikten toen al vele terabytes aan data voor hun operaties.
Nieuw in Big data is de grote verscheidenheid aan data formaten, een groot deel (men schat 80%) van deze data (bijvoorbeeld tweets, Facebook posts, foto’s en video) zijn daarbij ook nog eens ongestructureerd. Het is data die we niet kunnen weergegeven in een traditionele rij-kolom databases.

Big Data wordt vooral gebruikt om correlaties te vinden tussen fenomenen, personen en gebeurtenissen. Op basis van die correlaties worden vervolgens beslissingen genomen.
Bedrijven volgen ons traject online mbv “cookies” en gebruiken die data voor onlinemarketing en nog te vaak zonder onze toestemming.
De geheime diensten van diverse landen, speuren in vele datasets naar potentiele terroristen en anders denkenden.
Netflix kan een groot aanbod van films en series aanbieden. Daarnaast houdt Netflix in gigantische server farms bij wie, wanneer, hoe laat en hoe vaak kijkt. Als je overwegend een weekend-kijker bent, dan krijg je steevast elke vrijdag een e-mail met “ Ronald, we just added a movie you might like”.

Aan de andere kant van het data-spectrum hebben we small data.
Small Data staat voor kleine, gedetailleerde hoeveelheden data die – in tegenstelling tot Big Data – makkelijk opgeslagen en verwerkt kunnen worden.
Door de geringe omvang zijn de analyses doorgaans minder complex – je hebt geen high-end data-experts nodig om de data te begrijpen en verbanden te kunnen leggen. Kort door de bocht zou je kunnen zeggen dat alles wat in een Excelbestand past Small Data is. Het koppelen en analyseren van kleine datasets biedt evenals bij Big data concrete inzichten, door de kleinschaligheid kunnen bedrijven echter direct aan de slag kunnen.

Data (zowel small als Big) vormen de basis van informatie en kennis, maar ze krijgen pas vorm, betekenis en meerwaarde als ze op het juiste moment, in de juiste vorm bij de juiste persoon geïnterpreteerd kunnen worden. Data kan zich dan als relevante informatie voordoen. In vaktermen spreken we van “actionable business insights”

Om van data naar “actionable insights” te komen, worden analytics ingezet. Analytics stellen de business analist in staat om antwoorden te geven op bijvoorbeeld essentiële marketingvraagstukken, zoals wie zijn de meest waardevolle klanten zijn en waar liggen de grootste knelpunten in de webshop.

De “best practise” manier om met analytics aan de slag te gaan is formuleren van de bedrijfsdoelstellingen (wat wil het bedrijf analyseren), de data verzamelen, indien nodig opschonen en masseren, analyse van de data, de uitkomsten bekijken en acties ondernemen.
De uitkomsten worden vaak gevisualiseerd mbv grafieken en dashboards.

Bij small data gebruiken we “descriptive analytics”. Met behulp van Descriptive analytics gaat de analist na wat er in het verleden is gebeurd. Management krijgt antwoord op de vraag: “What happened and why did it happen?”

Bij Big data hebben de analisten predictive analytics en/of prescriptive analytics tot hun beschikking.

Nu men weet wat er gebeurd is in het verleden en wat de veroorzaak is, kan management zichzelf afvragen (maar alleen nadat er fors in IT systemen en mensen is geïnvesteerd) wat er in de toekomst gaat gebeuren. De vraag die je beantwoordt met predictive analytics is: “What will happen?” De volgende stap is door middel van prescriptive analytics de vraag: “How can we make it happen?” beantwoorden.

Het meest aansprekende voorbeeld hiervan is het Amerikaanse warenhuis Target. Die kan op basis van haar enorme database met historisch en actueel koopgedrag inschatten of een klant zwanger is of niet en deze klant sturen zwangerschapsartikelen en babyproducten bij Target te kopen.
Op basis van data analytics kwamen de analisten van Target er achter dat zwangere vrouwen in de tweede trimester van hun zwangerschap bepaalde artikelen als geurloze crèmes en zepen, voedingssupplementen zoals calcium, magnesium en zink begonnen te kopen. Extra grote pakken “cotton balls“, hand sanitizers en washandjes wijzen er dat de baby op komst is.
In één geval wist Target op basis van het koopgedrag dat dochterlief zwanger was terwijl de ouders dat nog niet wisten.

De geleerden zijn het erover eens dat economische groei wordt gedreven door “general purpose technologies”. Deze technologieën veranderen het aanzien van de economie fundamenteel. In de vorige eeuw hebben de stoommachine en elektriciteit dat al gedemonstreerd, ICT doet dat nu en zal in de komende jaren een nog grote impact hebben.
Het zal in de nabije toekomst vooral gaan om uit de beschikbare data met behulp van nieuwe tools en technieken die beschikbaar zijn en komen toegevoegde waarde te halen uit alle beelden & scans, spraak, tekst, muisklikken en sensordata. Dit kan een enorme aanjager zijn voor allerlei bedrijvigheid en nieuwe producten en diensten met kansen voor lokale entrepreneurs die hier op inspringen.

Potentiele Big data organisaties op Curaçao
De Politie heeft de beschikking over videocamera’s op voertuigen, langs drukke wegen en in de binnenstad. Deze camera’s kunnen worden gekoppeld aan verschillende databases, zodat automatisch kan worden gecontroleerd. Overigens: wetgeving op dit gebied is nog niet aangepast. De politie kan nog geen bekeuringen uitdelen op kenteken. De vraag is waarvoor deze data (naast verkeersovertredingen) gebruikt zal worden?

Utiliteitsbedrijf met het “slimme meters” project. Nadat het project is afgerond, kan de “slimme meter” afhankelijk van hoe men die instelt een gigantische hoeveelheid verbruiksinformatie zoals energie, vermogen, temperatuur, spanning, en de kwaliteit van de energie digitaal door geven aan een centrale computer. Met de slimme meter kan het bedrijf diefstal van water of elektriciteit opsporen naast andere technische “utilities” toepassingen.

Curaçao Toeristen Bureau (CTB)
CTB en haar ketenpartners verzamelen al heel wat bezoekers gerelateerde cijfers. Hoe cool zou het zijn als we van een bezoeker van de website van Curaçao.com mbv “streaming analytics” via zijn Facebook posts of andere social media interacties kunnen achterhalen dat zij een jazz-fan is en haar een “15% discount personalized coupon” kunnen aanbieden voor een Curaçao NSJF arrangement.

Bedrijven in de telecommunicatiesector beschikken over grote hoeveelheden eigen data.
Alleen al het gebruik van een smartphone kan qua informatie een goede weergave van een doorsnee dag van een gebruiker zijn. In de afgelopen vijf jaar hebben de ontwikkelingen in de techniek ervoor gezorgd dat deze grote hoeveelheid data nieuwe zakelijke kansen zijn geworden.

Hoewel Big Data veel potentie heeft, is het voor lokale bedrijven nu (nog) niet praktisch bruikbaar. Big Data is wat dat betreft nog een stip op de horizon. Wanneer zijn we klaar voor big data? Voor veel bedrijven geldt dat dat ze eerst maar eens met small data moeten beginnen. Managers realiseren zich vaak onvoldoende dat dit nu voor het grijpen ligt.”

Ronald Lieuw-Sjong is consultant bij Next Step Consulting NV (NSC) en lid van de Dutch Caribbean Economists.
NSC ondersteunt lokale en regionale bedrijven met procesmanagement en data analytics vraagstukken.