Dr Rebecca Pope, szefowa Data science and Engineering w KPMG, na konferencji Women of Silicon Roundabout w Londynie, stwierdziła, że przyszłością branży finansowej i każdej innej jest "big data". Można by, oczywiście, uznać, że każdy chwali obszar w którym pracuje, ale akurat za tym stwierdzeniem stoją mocne argumenty. Komputery, telefony, zegarki, wszelkiego rodzaju czujniki, a od jakiegoś czasu nawet lodówki i pralki - właściwie wszystko, co nas otacza generuje dane. To już fakt. Właściwa analiza i umiejętność odpowiedniego wykorzystania danych są kluczem do sukcesu każdego biznesu. Nic więc dziwnego, że specjaliści z tej dziedziny są dziś bardzo pożądanymi pracownikami na rynku pracy.
Dr Rebecca Pope przekonuje, że nie trzeba być doskonałym statystykiem ani wysokiej klasy matematykiem, aby pracować w tym obszarze. Nie jest wymagana także duża wiedza z zakresu programowania. Wystarczy zainteresowanie statystykami, chęć do nauki kodowania i wiedza o tym, jak wykonywać pewne operacje matematyczne na wysokim poziomie.
Moja rada byłaby taka, że jeśli zaczynasz karierę w dziedzinie danych, powinieneś specjalizować się w Pythonie - uczyń Python pierwszym językiem, którego się uczysz.
Sama dr Pope zaczynała od programu R. Nie studiowała matematyki, czy informatyki - z zawodu jest neurobiologiem. Uczestniczyła za to w niezliczonej ilości hackatonów, dzięki czemu zdobyła odpowiednią wiedzę i umiejętności. Dziś jest big date'owym guru.
Zobaczcie, czym - zdaniem dr Pope - różnią się poszczególne zawody, związane z big data. Nie bez powodu posiadające "data" w nazwie.
Data scientist, czyli mistrz: programista i analityk danych w jednym
Czy data scientist to naukowiec zajmujący się wyłącznie danymi? Zgarbiony informatyk z nosem zanurzonym w monitorze, przeglądający robaczki z cyfr? Nic z tych rzeczy! Data scientist ściśle współpracuje z biznesem i inżynierami danych. Jego rolą jest kompleksowe przeanalizowanie zagadnienia: od zrozumienia go poprzez przygotowanie i przetworzenie danych do zbudowania modelu, zwizualizowania go i stworzenia rekomendacji na podstawie wyniku analizy.
Data scientist musi więc doskonale odnajdywać się na polu statystyki. Dr Pope zaznacza przy tym, że większość algorytmów uczenia maszynowego opiera się na rachunku różniczkowym, algebrze liniowej i nieliniowej.
Od data scientist oczekuje się, że będzie potrafił przygotować dobrą wizualizację danych i będzie osobą komunikatywną. Ta cecha jest o tyle ważna, że data scientist musi współpracować z ludźmi, prezentować swoje modele i odkrycia w firmie i zachęcać współpracowników do korzystania z nich.
Data engineer, czyli mistrz programowania
Zadaniem inżyniera danych jest zbieranie i przetwarzanie surowych danych, ocena przydatności nowych źródeł informacji oraz projektowanie i uruchamianie nowych relacyjnych baz danych, które pozwalają na przechowywanie oraz przetwarzanie informacji napływających do systemu. Data engineer posługuje się przy tym współczesnymi narzędziami informatyki w zakresie projektowania i budowy baz danych, projektowania i budowy rozwiązań analitycznych, wdrażania systemów analityczno-informacyjnych we współdziałaniu ze specjalistami i managerami spoza domeny IT w organizacji.
Językami programowania i platformami potrzebnymi do zadań inżynierii danych są: Apache Spark, Scala, Docker, Java, Hadoop i Kubernetes NiFI.
Data analyst, czyli mistrz analizy danych
Analityk danych odpowiedzialny jest przede wszystkim za kontakt z biznesem: musi dowiedywać się, jakie dane są potrzebne. Do tego tworzy wizualizacje, które pozwolą firmie łatwo interpretować dane. Jednym słowem: zadaniem analityka danych jest „interpretowanie bieżących informacji, aby były przydatne dla biznesu”.
W roli analityka danych niewiele jest modelowania uczenia maszynowego lub wdrażania uczenia maszynowego. Zdaniem dr Pope, każdy kto chce być analitykiem danym powinien przede wszystkim zrozumieć, jak korzystać z oprogramowania do analizy predykcyjnej RapidMiner i Postgresql, relacyjnej bazy danych open source.
Źródło:
- Inżynier danych, WUP Kielce, 2016.
-
What's the difference between a data engineer, a data analyst and a data scientist?, news.efinancialcareers.com.