Fiasko Data Scientist’a?
Już nikogo nie trzeba przekonywać, że analizowanie danych jest ważne w dzisiejszym biznesie. Oczywiście nie analizowanie dla analizowania, ale dla uzyskiwania i ciągłego podtrzymywania przewagi konkurencyjnej prowadzącej do wzrostu przychodów i / lub obniżenia kosztów. Zdarzają się też całkiem częste przypadki w branżach regulowanych, kiedy analizowanie danych pozwala upewniać się firmie, czy i jak zachowywać zgodność z wymaganiami prawnymi. Wiele firm doradczych zaleca zatrudnianie magików od analizowania danych, czyli tak zwanych Data Scientist’ów. To nowa rola w organizacji, z jeszcze nie dość jasno sprecyzowanym rodzajem odpowiedzialności – ciągle wchodząca w kompetencje innych, szturchająca architektów IT, analityków biznesowych, programistów i innych pogromców danych. Może właśnie przez to, jeszcze zanim na dobre zadomowiła się w strukturach firm, już stała się mocno kontrowersyjna.
Tak jak dość intuicyjne i jednoznaczne jest przypuszczenie, że Data Scientist powinien być przydatnym pracownikiem w każdej firmie, tak mocno nieoczywiste jest to, czym powinien zajmować się na co dzień.
To przyjrzyjmy się może, co też takiego robią często nowo zatrudnieni w roli Data Scientist i zastanówmy się, czy aby na pewno chcemy za to właśnie im płacić… Jak często można przeczytać w internecie, zajmują się oni częściej organizowaniem danych, a mniej czasu poświęcają na ich analizowanie. Zdarza się tak głównie w przypadku firm z nierealistycznymi oczekiwaniami (brakiem świadomości) odnośnie stanu swych danych. Rozczarowanie takiej osoby jest spore, bo zamiast odkrywać ukryte powiązania między danymi, szukać odpowiedzi na pytania biznesowe, zajmuje się poprawą jakości danych, dostępnością źródeł danych, a czasami nawet po prostu digitalizacją danych.
Zanim zdecydujesz się na zatrudnianie osób w roli Data Scientist, być może potrzebujesz pomocy w przejrzeniu lub stworzeniu właściwej architektury IT, zasobów lub umiejętności, by korzystać w pełni z umiejętności magika. Duże znaczenie ma tutaj również kultura organizacyjna – jak szybko potrafimy wprowadzać zmiany i nowe rozwiązania wynikające z odkryć Data Scientist’a. Czy wystarczająco szybko, czy też będziemy marnowali rezultaty prac naszych magików ?
Pytanie brzmi, czy chcesz marnować pieniądze na zatrudnianie Data Scientist’ów w przypadku, kiedy dane nie są gotowe, by można było na nich pracować ? Każda firma powinna posiadać procesy i osoby odpowiedzialne za dbanie o jakość i dostępność danych – i nie jest to rola Data Scientist’ów, jeśli chcemy, by zajmowali się tematami interesującymi i innowacyjnymi. Nie twierdzę, że zarządzanie danymi i data governance są nudne i mało inspirujące, ale wymagają nieco innego zestawu umiejętności.
Dane określane mianem Big Data są z natury rzeczy bałaganem. To w końcu konglomerat danych z różnych źródeł, z różnych okresów czasu, w różnych strukturach, a często w ogóle nieustrukturalizowanych (słowo-kandydat do scrabble). Niektórzy Data Scientist akceptują fakt, że częścią ich pracy jest organizowanie danych i zajmują się tym, kosztem czasu, który mogliby spędzić odpowiadając na pytania biznesowe. Efektem tego są opóźnienia w uzyskiwaniu tych odpowiedzi i co za tym idzie wydłuża się czas potrzebny na wprowadzenie zmian w biznesie. Oczywiście ktoś powinien zajmować się „ogarnięciem” danych, tylko czy powinna być to osoba, której płacimy tak duże pieniądze za analizy mające wpływ na poważne decyzje biznesowe i kierunek rozwoju firmy. Prawdopodobnie nie.
Pomimo tego, że pełen zakres zadań Data Scientist’a może różnic się w zależności od branży, czy firmy, nie da się ukryć, że jeśli są wykorzystywani prawidłowo, dają dużą wartość dla przedsiębiorstwa. Jeden z raportów, o którym ostatnio czytałem pokazywał badanie, w które firmy zatrudniające Data Scientist’a zwiększały organicznie przychody rok do roku nawet o 15%.