Met Data Science tools zijn we op een punt aangekomen dat je een dataset erin kunt rammen en de tovenarij van de tool vertelt welk model het beste werkt voor uw data. Voer het dan simpelweg uit tegen een dataset om bijvoorbeeld de verkoop van volgend jaar te voorspellen. Oftewel, wat is de toegevoegde waarde van Data Scientists nog in de zoektocht naar verborgen goud? Want waarom zou je het verschil tussen Naïve Bayes en dergelijke moeten bevatten, als de tool engine zegt dat het wint met 99,6% versus 94,2%...
Neem van mij aan, dingen kunnen vrij snel misgaan. Bijvoorbeeld, u gebruikt als kersverse salesmanager een dataset met 10 jaar bedrijfsgegevens om enkele voorspellingen te doen. Een goede keuze op zichzelf, maar heeft iemand u verteld dat het businessmodel in die periode een paar keer is veranderd? Of dat de supply chain gedurende een paar jaar te zwak was voor de marktvraag? Om nog maar te zwijgen van de wankele datamigratie tijdens de overstap naar een ander ERP-systeem, waardoor het bedrijf te maken kreeg met een hoop verborgen issues in datakwaliteit. Al deze dingen zijn van belang, en nog veel meer wanneer een tool vrijwel directe voorspellingen aanbiedt.
Data Science wordt niet gedaan door het uitrollen van een tool. Het is een continue reis van doorploegen van gegevens, waarbij je soms ook een potje er mee moet knokken. Betrek collega's hierbij, want het is het beste om gegevens en uw ontdekkingen te relateren aan een gedeeld begrip over de business. Zij weten misschien wel enkele interessante invalshoeken voor uw verhaal. Als je een voorgevoel hebt, verander het dan zo snel mogelijk in een businesscase, want slechts een mijnwerkershelm opzetten en graven in gegevens biedt weinig goud.
Goede Data Scientists zullen u door al deze processen begeleiden en u helpen om de juiste statistiek toe te passen over goed begrepen data. Vervolgens kunt u daadwerkelijk data omzetten in goud. Jazeker, geavanceerde hulpmiddelen zullen u en hen zeker helpen. Maar er is nog veel meer voor nodig om ervoor te zorgen dat u Data Science gaat laten werken!