Data Engineer/ML Engineer
e-point SA
Rola Data Engineera/ML Engineera w projekcie dla państwowej jednostki lotnictwa cywilnego. Odpowiadasz za projektowanie, budowę i utrzymanie potoków danych (batch i stream), modelowanie danych, CI/CD, konteneryzację, oraz elementy MLOps (rejestr eksperymentów, wdrożenia modeli). Pracujesz w Scrum, współpracujesz z Data Scientistami i Product Ownerem. To nie jest rola badawcza ML, ale inżynieria danych z rozszerzeniem o MLops.
Brakuje: brak informacji o wielkości zespołu i liczbie data scientistów/ml engineerów, nie podano konkretnych narzędzi mlops (np. mlflow, kubeflow, neptune).
Rola Data Engineera/ML Engineera w projekcie dla państwowej jednostki lotnictwa cywilnego. Odpowiadasz za projektowanie, budowę i utrzymanie potoków danych (batch i stream), modelowanie danych, CI/CD, konteneryzację, oraz elementy MLOps (rejestr eksperymentów, wdrożenia modeli). Pracujesz w Scrum, współpracujesz z Data Scientistami i Product Ownerem. To nie jest rola badawcza ML, ale inżynieria danych z rozszerzeniem o MLops.
- ✓Płaska struktura zarządzania i samoorganizujące się zespoły
- ✓Duża autonomia i przestrzeń na własną inicjatywę
- ✓Nowoczesny stack technologiczny (Spark, Kafka, Docker, Kubernetes, CI/CD, MLOps)
- ✓Praca na sprzęcie firmowym
- !Możliwość delegacji na terenie UE/Wielkiej Brytanii – może oznaczać podróże służbowe
- !Nie podano wielkości zespołu ani struktury
- !Projekt dla państwowej jednostki: może wiązać się z biurokracją i sztywnymi procesami
- •Projektowanie i implementacja potoków ETL/ELT dla danych wsadowych i strumieniowych (Spark, Kafka)
- •Modelowanie danych w warstwach surowych, przetworzonych i prezentacyjnych
- •Utrzymanie i rozwój CI/CD dla artefaktów danych i modeli (repozytoria, pipeline'y)
- •Konteneryzacja usług danych i inferencji (Docker, Kubernetes, manifesty, rollou'ty)
- •Integracja narzędzi MLOps (rejestr eksperymentów, śledzenie metryk, automatyzacja wdrożeń)
- •Optymalizacja wydajności zapytań, partycjonowanie, kompresja, cache'owanie
- •Implementacja testów jednostkowych, integracyjnych i walidacji jakości danych
- •Wsparcie Data Scientistów w przygotowaniu danych cech i materializacji widoków
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Data Engineer z minimum 2-letnim doświadczeniem w budowie potoków danych, znajomością SQL i podstaw Big Data, który zna Docker i Kubernetes w stopniu podstawowym.
Osoby szukające w pełni zdalnej pracy bez konieczności dojazdów do biura w Warszawie. Kandydaci nastawieni wyłącznie na badania ML (ML research) bez zainteresowania inżynierią danych i DevOps.
- ?Ile osób liczy zespół Data/ML i jakie są role w zespole?
- ?Czy podany stack (Spark, Kafka, Docker, Kubernetes) jest rzeczywiście używany produkcyjnie, czy to planowane technologie?
- ?Jak często wymagane są wizyty w biurze w Warszawie? (np. dni w tygodniu/miesiącu)
- ?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe?
- ?Czy klient (państwowa jednostka) ma własne ograniczenia dotyczące narzędzi/technologii (np. tylko open source, określona chmura)?
- ?Jaki stosunek pracy stanowi data engineering vs MLOps?
- ?Czy istnieje możliwość pracy zdalnej z zagranicy (np. delegacje) – czy to raczej okazjonalne wyjazdy?
- −Brak informacji o wielkości zespołu i liczbie Data Scientistów/ML Engineerów
- −Nie podano konkretnych narzędzi MLOps (np. MLflow, Kubeflow, Neptune)
- −Brak opisu procesu rekrutacyjnego
- −Brak informacji o budżecie szkoleniowym lub konferencyjnym
- −Nie wspomniano o systemie kontroli wersji (Git) – choć sugerowany przez CI/CD i wersjonowanie
- −Brak informacji o środowisku chmurowym (on-prem, chmura, hybryda – tylko wzmianka w zadaniach)
Samoorganizujące się zespoły z płaską strukturą, duża autonomia i przestrzeń na inicjatywę – kultura sprzyjająca odpowiedzialności i samodzielności.