Jos van Dongen’s Big Data Reality Check
Afgelopen woensdag was Jos van Dongen bij Info Support te gast voor een Big Data Reality Check: waar draait het nu écht om bij de overhyped termen big data, data science en Hadoop. Zit er substantie achter de hype en waar kun je succes behalen (en waar niet). Jos is werkzaam bij SAS, maar is nog steeds regelmatig als onpartijdig spreker te zien op nationale en internationale conferenties. Afgelopen woensdag dus bij ons.
Eén van de dingen waar Jos het aanwezige publiek mee prikkelde, was de hype rond big data. Op de vraag ‘wat is het nu precies’, kwamen in eerste instantie de drie (of inmiddels vijf) V’s om de hoek kijken. Naast volume, velocity en variety, nu ook veracity (letterlijk vertaald: waarheidsgetrouwheid) en value. Vervolgens werd de laatste Gartner hype cycle getoond waarin de term Big Data dit jaar niet meer voorkomt. Volgens Garter is big data dus dood…? Gelukkig, dan kunnen we het vanaf nu weer gewoon over data hebben en gaan kijken naar de manier waarop we in een specifiek geval met specifieke data om moeten gaan, waarbij Hadoop in sommige gevallen voordelen biedt, maar in andere ook helemaal niet.
Jos vervolgt zijn verhaal met het onderwerp data science en de vele eisen waaraan een echte data scientist moet voldoen. Bijna niet te verenigen in één persoon zonder een schaap met vijf poten te hebben. Kortom, data science teams hebben meer kans van slagen dan een paar échte data scientists te vinden. Maar iets van data science afweten, daar wordt je de komende jaren niet slechter van. Want “data scientists have more fun” en ze verdienen ook niet slecht… Wil je er mee beginnen, dan is het boek Data Science for Business van Provost en Fawcett de beste start, aldus Jos. Een andere leuke plek voor de (beginnende) data scientist is Kaggle. En SQL still matters (a lot!).
Met een blik op de wereld van Machine Learning en de kansen en de mogelijkheden die daar liggen en een kort overzicht van big data succesverhalen bij Nederlandse bedrijven, sluit Jos een leuke sessie af die voor de één meer nieuwe informatie zal hebben bevat dan voor de ander. Big data is dead, een goede boektip voor data science en de uitspraak “SQL still matters”, zijn mijn take aways.