Data Scientist
e-point
To klasyczna rola Data Scientist w agencji IT dla kluczowego klienta z sektora lotnictwa cywilnego (państwowa jednostka). Będziesz zajmować się pełnym cyklem ML: od pozyskiwania i czyszczenia danych, przez EDA, inżynierię cech, trenowanie i walidację modeli (klasyfikacja, regresja, szeregi czasowe, NLP), aż po przygotowanie do wdrożenia i monitoring produkcyjny. Dodatkowo analiza A/B, dokumentacja i optymalizacja procesów zespołu.
Brakuje: nie podano liczby osób w zespole, brak informacji o konkretnych narzędziach mlops (np. mlflow, dvc, kubeflow).
To klasyczna rola Data Scientist w agencji IT dla kluczowego klienta z sektora lotnictwa cywilnego (państwowa jednostka). Będziesz zajmować się pełnym cyklem ML: od pozyskiwania i czyszczenia danych, przez EDA, inżynierię cech, trenowanie i walidację modeli (klasyfikacja, regresja, szeregi czasowe, NLP), aż po przygotowanie do wdrożenia i monitoring produkcyjny. Dodatkowo analiza A/B, dokumentacja i optymalizacja procesów zespołu.
- ✓Płaska struktura i samoorganizujące się zespoły – duża autonomia
- ✓Możliwość delegacji zagranicznych (UE/Wielka Brytania)
- ✓Własna inicjatywa mile widziana
- ✓Praca na sprzęcie firmowym
- !Szeroki zakres odpowiedzialności (od ML po automatyzację i szablony raportów) – może oznaczać rozmycie roli
- !Praca w sektorze publicznym może wiązać się z biurokracją i wolniejszym tempem
- !Brak informacji o konkretnych narzędziach MLOps (np. MLflow, Kubeflow) – mogą być narzucone przez klienta
- !Hybryda z 'okazjonalnymi' wizytami – nie wiadomo jak często faktycznie trzeba być w biurze
- •Pozyskiwanie, czyszczenie i transformacja danych z wewnętrznych i zewnętrznych źródeł (SQL/NoSQL)
- •Eksploracyjna analiza danych (EDA): profilowanie, identyfikacja wzorców, trendów, korelacji i anomalii
- •Inżynieria cech, selekcja zmiennych i przygotowanie zbiorów treningowych/walidacyjnych/testowych
- •Projektowanie, trenowanie, strojenie hiperparametrów i walidacja modeli ML (scikit-learn, sieci głębokie) dla różnych zadań
- •Ocena modeli przy użyciu metryk (dokładność, precyzja, F1, ROC-AUC, RMSE itp.) i dokumentowanie eksperymentów
- •Współpraca z Product Ownerem przy definiowaniu hipotez, KPI i kryteriów sukcesu; udział w Scrum (refinements, przeglądy)
- •Przygotowanie modeli do wdrożenia z Data/ML Engineerami oraz wsparcie w integracji i monitorowaniu (drift, stabilność)
- •Analiza i wizualizacja wyników dla interesariuszy, storytelling danych, przygotowanie materiałów decyzyjnych
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Mid-level Data Scientist z co najmniej 1 rokiem doświadczenia w ML, solidną znajomością Pythona i SQL oraz podstawami MLOps. Osoba potrafiąca samodzielnie przeprowadzić EDA i zbudować model, ale wspierana przez zespół w kwestiach wdrożeniowych.
Juniorzy bez komercyjnego doświadczenia w ML, osoby szukające wyłącznie pracy zdalnej (hybryda z okazjonalnymi wizytami w biurze) oraz kandydaci niechętni do pracy w sformalizowanym środowisku publicznym z dużą ilością dokumentacji.
- ?Ile osób liczy zespół Data Science/ML?
- ?Jakie konkretnie narzędzia MLOps są używane (rejestr eksperymentów, monitoring)?
- ?Jak często planowane są wizyty w biurze w Warszawie?
- ?Czy modele są wdrażane na produkcji, a jeśli tak, to w jakim środowisku (on-prem/cloud)?
- ?Jakie biblioteki głębokiego uczenia są preferowane (TensorFlow, PyTorch)?
- ?Czy istnieje dyżur on-call przy monitorowaniu modeli produkcyjnych?
- ?Jak wygląda proces decyzyjny – czy zespół ma wpływ na wybór algorytmów i narzędzi?
- −Nie podano liczby osób w zespole
- −Brak informacji o konkretnych narzędziach MLOps (np. MLflow, DVC, Kubeflow)
- −Nie określono wymagań dotyczących głębokiego uczenia (framework, GPU)
- −Brak opisu procesu rekrutacyjnego (etapy, zadanie domowe itp.)
- −Nie wiadomo jaka jest docelowa skala systemu (liczba modeli, częstotliwość retrainingu)
Płaska struktura, samoorganizujące się zespoły, duża swoboda w inicjatywie – kultura startupowa w agencji, ale z klientem z sektora publicznego.
Poniżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Machine Learning. Pełne statystyki zarobków →