Data Scientist na rozmowie kwalifikacyjnej – jak się przygotować i czego się spodziewać? [artykuł]

sty 19, 2018

Data Science

Data Driven

Procesy rekrutacyjne na stanowiska w obszarze Data Science są z reguły dość długotrwałe i wymagające. Nie jest bowiem łatwo znaleźć na rynku kandydata o pożądanym profilu i podczas stosunkowo krótkiej rozmowy kwalifikacyjnej trafnie ocenić posiadane przez niego kompetencje i wartość, jaką może wnieść do organizacji. W jaki sposób potencjalny kandydat powinien się przygotować do spotkania z rekruterem, by zwiększyć swoje szanse na otrzymanie oferty? Jakich pytań może się spodziewać na rozmowie rekrutacyjnej?  

Analityk danych potrzebny od zaraz

Od publikacji słynnego już artykułu Harvard Business Review, w którym profesja Data Scientist zyskała niezwykle nośne miano „najseksowniejszego zawodu XXI wieku” minęło wprawdzie kilka lat, jednak niewiele się w tej kwestii zmieniło. Rola badacza danych wciąż rozpala wyobraźnię wielu analityków, a rosnące zapotrzebowanie rynku na specjalistów w tej dziedzinie i kształtujące się wysoko powyżej przeciętnej wynagrodzenia tylko potęgują ten efekt. Czy rzeczywiście rynek zaczął wreszcie doceniać wysoko wykwalifikowanych fachowców w obszarze analiz, uczenia maszynowego i wizualizacji danych? Zdecydowanie tak. Niewątpliwie prym pod tym względem wiodą Stany Zjednoczone. To właśnie tutejsze firmy jako pierwsze zaczęły na dużą skalę dostrzegać potencjał drzemiący w firmowych bazach danych i wykorzystywać je w procesie podejmowania kluczowych decyzji biznesowych. Nie dziwi zatem fakt, iż właśnie w USA liczba ofert pracy dla badaczy danych jest największa, a jej wzrost tak dynamiczny.

Z opublikowanego w grudniu ubiegłego roku raportu „LinkedIn’s 2017 U.S. Emerging Jobs Report” jasno wynika, że analitycy danych w Stanach Zjednoczonych nie muszą się obawiać o swoją przyszłość. Ranking tzw. Emerging Jobs otwiera rola Machine Learning Enginer. Liczba ofert pracy dla inżynierów uczenia maszynowego, opublikowanych w serwisie Linkedin, w 2017 roku względem 2012 roku wzrosła aż o 950 %! Rola badacza danych z wynikiem 650 % zajmuje drugie miejsce na podium. Naturalnie nie są to jedyne analityczne role w zestawieniu – w pierwszej dziesiątce znalazły się również stanowiska Big Data Developer oraz Director of Data Science ze wzrostami wynoszącymi odpowiednio 550 % i 490 %. Jakiego kierunku zmian można oczekiwać w przyszłości? Perspektywy są naprawdę obiecujące, o czym przekonuje m. in. IBM. Zdaniem analityków tej amerykańskiej firmy do 2020 roku w samych tylko Stanach Zjednoczonych liczba stanowisk w obszarze szeroko rozumianej analizy danych wzrośnie do 2,720,000, z czego niespełna 62 tys. stanowić będą najbardziej wymagające role, przeznaczone dla badaczy danych i doświadczonych analityków. Jakie kompetencje musi posiadać Data Scientist, by zwiększyć swoje szanse na znalezienie się w tym elitarnym gronie? Odpowiedź na to pytanie znaleźć można w naszym artykule o kompetencjach – link.

Badacz danych na rozmowie rekrutacyjnej

Ogromne zapotrzebowanie na specjalistów zajmujących się analizą danych, zarówno tych o niższych kwalifikacjach jak i bardziej doświadczonych badaczy danych, wcale nie oznacza, że znalezienie pracy jest łatwe. Organizacje na całym świecie doskonale zdają sobie sprawę z biznesowej wartości skrywanej przez gromadzone dane oraz trudności jakie towarzyszą ich monetyzacji. Stawiają tym samym przed potencjalnymi kandydatami szereg wymagań, których spełnienie wiąże się z reguły z koniecznością poświęcenia przynajmniej kilku lat na intensywną naukę i gromadzenie biznesowych doświadczeń. Szczególnie istotną rolę w przypadku rekrutacji na stanowisko badacza danych odgrywają umiejętności zastosowania posiadanej wiedzy i kompetencji technicznych przy pracy na realnych projektach. Programowanie nawet w kilku językach, doskonała znajomość narzędzi przeznaczonych do wizualizacji danych i znajomość statystycznych zagadnień nie zrobią wrażenia na hiring managerze, jeśli problem stanowić będzie skuteczne zidentyfikowanie problemu biznesowego, zaproponowanie optymalnego rozwiązania i sformułowanie rekomendacji dla osób decyzyjnych w organizacji.

Między innymi z tego względu istotną rolę w procesie rekrutacyjnym w obszarze Data Science odgrywa portfolio. Portfolio do niedawna zarezerwowane było wyłącznie dla przedstawicieli branży twórczej i artystycznej. Dziś jego zastosowanie jest znacznie szersze – obejmuje chociażby specjalistów IT oraz dynamicznie rozwijającą się branżę analityczną. Posiadanie interesującego, pełnego ciekawych projektów portfolio to niewątpliwy atut, jednak nie należy zapominać o innych elementach, które mogą finalnie zaowocować podpisaniem kontraktu.

Podobnie jak w przypadku wszystkich innych rozmów kwalifikacyjnych, niezwykle istotne jest gruntowne zapoznanie się z opisem stanowiska i wymaganiami stawianymi przez potencjalnego pracodawcę. Działanie takie jest kluczowe z przynajmniej dwóch względów. Ogromne zainteresowanie jakie budzi świat Big Data i Data Science sprawia, że terminy te są niezwykle często nadużywane. Może się zatem okazać, że potencjalnie interesująca nas rola badacza danych w rzeczywistości ma niewiele z nią wspólnego. Druga kwestia to możliwość zorientowania się poprzez dokładne zapoznanie się z treścią ogłoszenia, jakie kompetencje miękkie są kluczowe, jakie kwalifikacje techniczne wymagane, a które jedynie pożądane. Dokładna analiza oferty pozwala tym samym nie tylko na stworzenie CV, które będzie podkreślało kluczowe dla danego procesu rekrutacyjnego kompetencje, ale również na mniej lub bardziej skuteczne przewidzenie pytań, jakie mogą się pojawić podczas ewentualnej rozmowy kwalifikacyjnej.

Brak odpowiedniego przygotowania i gruntownej analizy konkretnej oferty istotnie zmniejsza prawdopodobieństwo otrzymania wymarzonej pracy w charakterze Data Scientist. Bez wiedzy na temat zakresu przyszłych obowiązków oraz oczekiwań na konkretnym stanowisku niezwykle trudno jest stworzyć CV, które zdoła przykuć uwagę rekrutera i skłonić go do zapoznania się z portfolio. By nie stracić szansy na bycie zaproszonym do rozmowę kwalifikacyjną również portfolio powinno być w maksymalnym stopniu dopasowane do oczekiwań potencjalnego pracodawcy. Odpowiedni dobór projektów analitycznych niewątpliwie utwierdzi rekrutera w przekonaniu, że znalazł właśnie kandydata, którego warto zaprosić na rozmowę kwalifikacyjną.

Pytania rekrutacyjne, jakich można się spodziewać

Pierwszy etap procesu rekrutacyjnego odbywa się zwykle bez aktywnego udziału kandydata. Jego rola ogranicza się do przygotowania dokumentów aplikacyjnych i oczekiwania na ewentualne zaproszenie na rozmowę rekrutacyjną. Pozytywne jego rozwiązanie nie oznacza jednak końca wysiłków i przygotowań. Przed postawieniem stopy w pokoju rekrutacyjnym, warto raz jeszcze wrócić do opisu stanowiska i spróbować postawić się w roli rekrutera. Działanie takie pozwoli na sformułowanie listy prawdopodobnych pytań, które mogą paść podczas rozmowy w celu potwierdzenia posiadanych kompetencji – zarówno te technicznych jak i miękkich. Co warto podkreślić, rozmowa kwalifikacyjna odbywa się zwykle z udziałem bądź wyłącznie z hiring managerem, a więc osobą, która doskonale orientuje się w obszarze Big Data. W przypadku tak wymagających i technicznych stanowisk jak Data Scientist właściwe zweryfikowanie przez specjalistę ds. rekrutacji posiadanych przez kandydata kompetencji byłoby mocno utrudnione. Należy się zatem spodziewać przynajmniej kilku konkretnych pytań. Pytań, które sprawdzą przygotowanie techniczne, kompetencje miękkie, zainteresowania oraz świadomość biznesową kandydata.

Jakich konkretnie pytań badacz danych może się spodziewać na rozmowie kwalifikacyjnej? Te mogą być naprawdę różnorodne. O odmiennym stopniu złożoności i trudności. Bywa, że rozmowa skoncentrowana jest na kwestiach stricte technicznych lub w przypadku doświadczonych specjalistów niemalże w całości poświęcona dotychczasowym doświadczeniom w rozwiązywaniu złożonych i niestandardowych problemów z danymi. Zdarzają się również rozmowy, podczas których sprawdzane są znajomość zagadnień statystycznych, biegłość w obsłudze wykorzystywanych narzędzi, świadomość biznesowa czy kreatywność i umiejętność rozwiązywania problemów. Biorąc pod uwagę powyższe na rozmowie rekrutacyjnej padają zarówno pytania podtrzymujące rozmowę, wymagające chociażby wskazania własnego autorytetu w obszarze Big Data, jak i nieco bardziej konkretne, dotyczące klasyfikatorów binarnych, wartości odstających, odchyleń i wariancji, regularyzacji itd.

Do przykładowych i całkiem prawdopodobnych pytań na rozmowie kwalifikacyjnej badacza danych zaliczyć można poniższe:

1) W jaki sposób ustalić, które funkcje w stworzonym modelu są najważniejsze?
2) Jakie czynniki decydują o tym, że wizualizację danych można uznać za efektywną?
3) Dlaczego nie zawsze uwzględnienie większej liczby czynników prognostycznych jest właściwe?
4) W jaki sposób „uodpornić” model na wpływ wartości odstających?
5) Jak radzić sobie z problemami z jakością danych?
6) Czym są testy A / B i jakie znajdują zastosowanie w obszarze Data Science?
7) Czym jest analiza przyczyn źródłowych?
8) Jak zaprojektować skutecznie działający system rekomendacji?
9) Na czym polega paradoks wyniku fałszywie pozytywnego?
10) Jakie narzędzie wizualizacji danych jest najskuteczniejsze?

Dokładniejsza analiza postów na blogach dedykowanych tematyce data science oraz dyskusji toczących się na forach dyskusyjnych pozwala wnioskować, że pytania rekrutacyjne adresowane do badaczy danych, mimo iż dla większości wręcz abstrakcyjne, nie odbiegają od ogólnych standardów. Cel ich formułowania jest bowiem dokładnie taki sam jak w kontekście wszystkich innych stanowisk – znalezienie, a następnie zatrudnienie odpowiedniego kandydata. Z tego też względu pytania można podzielić na trzy podstawowe grup: pytania dotyczące zachowań (sprawdzające kompetencje miękkie), pytania dotyczące kompetencji (weryfikujące zgodność z profilem idealnego kandydata) oraz pytania hipotetyczne (pozwalające na ocenę kreatywności i umiejętności wykorzystania posiadanej wiedzy w rozwiązywaniu realnych problemów biznesowych). By cały proces rekrutacyjny zakończył się ofertą pracy, należy być przygotowanym na każde z wymienionych powyżej pytań.