Senior/Principle Data Engineer with strong MLOps expertise
Intellias
Jako Senior/Principal Data Engineer z silnym naciskiem na MLOps będziesz odpowiedzialny za projektowanie i automatyzację produkcyjnych pipeline'ów danych i ML w Azure Databricks. Pracujesz na przecięciu inżynierii danych, automatyzacji infrastruktury i ML, zamieniając prototypowe rozwiązania w skalowalne, obserwowalne i opłacalne pipeline'y. Praca zdalna, B2B, dla klienta – holenderskiego giganta technologii lokalizacyjnych (navigation, consumer electronics).
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: nie opisano procesu rekrutacyjnego, brak informacji o liczbie osób w zespole.
Jako Senior/Principal Data Engineer z silnym naciskiem na MLOps będziesz odpowiedzialny za projektowanie i automatyzację produkcyjnych pipeline'ów danych i ML w Azure Databricks. Pracujesz na przecięciu inżynierii danych, automatyzacji infrastruktury i ML, zamieniając prototypowe rozwiązania w skalowalne, obserwowalne i opłacalne pipeline'y. Praca zdalna, B2B, dla klienta – holenderskiego giganta technologii lokalizacyjnych (navigation, consumer electronics).
- ✓Kontrakt B2B z premią z góry na pokrycie kosztów medycyny i sportu
- ✓Budżet na kursy (Coursera, O'Reilly, Udemy) oraz korporacyjna szkoła językowa
- ✓Praca nad nowoczesnym stackiem (MLOps, Databricks, CI/CD) dla znanej marki
- ✓Możliwość wpływania na architekturę i procesy
- !Rola jest w modelu outsourcingowym (Intellias jako software house dla zewnętrznego klienta) – może wpływać na stabilność i kulturę
- !Wymagana jest bardzo wąska specjalizacja w ekosystemie Databricks – ryzyko vendor lock-in
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie i utrzymanie end-to-end pipeline'ów danych i ML w Databricks (bronze–silver–gold layers, schema evolution, access policies)
- •Budowanie frameworków jakości danych i metryk obserwowalności (data quality, model performance, operational metrics)
- •Automatyzacja zadań ingesti danych i feature generation z użyciem PySpark, SQL Warehouses, Databricks Asset Bundles (DAB) w CI/CD (GitHub Actions, Azure DevOps)
- •Tworzenie reprodukowalnych pipeline'ów trenowania i deployu modeli z experiment trackingiem i model registry
- •Zarządzanie dostępem, bezpieczeństwem i compliance w Unity Catalog
- •Optymalizacja wydajności i kosztów (spot/autoscaling, cluster tuning, caching, partitioning)
- •Monitorowanie i budowa dashboardów (Lakeview, Grafana) dla metryk danych i modeli
- •Współpraca z zespołami technicznymi i nietechnicznymi, tłumaczenie wymagań
Oferta dla doświadczonych specjalistów (Senior).
Mid-level Data Engineer z solidnym Pythonem i praktyką w Azure oraz Databricks, który ma podstawy MLOps (pipelines, experiment tracking) i chce rozwijać się w stronę automatyzacji i zarządzania produkcją.
Juniorzy bez doświadczenia w chmurze i Databricks, osoby szukające pracy stacjonarnej, lub inżynierowie skupieni wyłącznie na data science/modelowaniu bez umiejętności inżynieryjnych.
- ?Ile osób liczy zespół data engineering / MLOps przy tym projekcie?
- ?Jaki jest aktualny stan pipeline'ów – zielone pole czy modernizacja istniejących?
- ?Czy przewidziane są dyżury on-call? Jeśli tak, jaka jest ich częstotliwość i rekompensata?
- ?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe lub live coding?
- ?Jakie są perspektywy rozwoju – czy rola może ewoluować w stronę architekta lub lidera?
- ?Czy istnieje możliwość wyboru preferowanych narzędzi CI/CD (GitHub Actions vs Azure DevOps)?
- ?Jakie są oczekiwania dotyczące liczby godzin pracy tygodniowo i dostępności?
- −Nie opisano procesu rekrutacyjnego
- −Brak informacji o liczbie osób w zespole
- −Nie wspomniano o ewentualnych dyżurach on-call