Data / MLOps Engineer (AWS, PySpark, SageMaker)
Lumicode Sp. z o.o. (Pentacomp Group)
Rola łączy Data Engineering, Cloud Engineering i MLOps. Będziesz projektować i optymalizować platformy danych oraz infrastrukturę ML na AWS, budować potoki danych w Spark/PySpark i wdrażać modele ML do produkcji z użyciem SageMaker. Praca z Data Scientistami nad automatyzacją trenowania, wersjonowania i monitorowania modeli w skali produkcyjnej.
Brakuje: wielkość zespołu, opis konkretnego projektu.
Rola łączy Data Engineering, Cloud Engineering i MLOps. Będziesz projektować i optymalizować platformy danych oraz infrastrukturę ML na AWS, budować potoki danych w Spark/PySpark i wdrażać modele ML do produkcji z użyciem SageMaker. Praca z Data Scientistami nad automatyzacją trenowania, wersjonowania i monitorowania modeli w skali produkcyjnej.
- ✓W 100% remote
- ✓Długoterminowa współpraca B2B z jasno określoną stawką
- ✓Międzynarodowe środowisko i cross-funkcyjne zespoły
- ✓Wpływ na architekturę i najlepsze praktyki inżynieryjne
- ✓Praca nad dużymi inicjatywami AI/ML
- !Brak konkretnego opisu projektu – ogólny zakres zadań
- !Nie wymieniono konkretnych narzędzi CI/CD
- !Firma usługowa – możliwa praca u różnych klientów
- •Projektowanie i budowa end-to-end platform MLOps
- •Automatyzacja trenowania, wdrażania i wersjonowania modeli
- •Budowa i optymalizacja skalowalnych potoków danych w PySpark i Apache Spark
- •Wdrażanie i zarządzanie modelami ML na AWS SageMaker
- •Implementacja CI/CD i Continuous Training dla ML
- •Monitorowanie wydajności modeli, jakości danych i dryfu
- •Współpraca z Data Scientistami przy produkcjonizacji modeli
- •Tworzenie infrastruktury jako kodu i dokumentacji technicznej
Oferta dla doświadczonych specjalistów (Senior).
Inżynier z solidnym Python i PySpark, przynajmniej 3 lata w data engineering lub MLOps, z podstawowym doświadczeniem AWS i pierwszymi wdrożeniami ML.
Nie dla juniorów bez doświadczenia w produkcji ML ani dla inżynierów unikających infrastruktury i operacji na co dzień.
- ?Jaki jest konkretny projekt i jego skala (liczba modeli, data volume)?
- ?Ile osób liczy zespół Data/ML i jak są rozdzielone role?
- ?Jakie narzędzia CI/CD są używane (np. Jenkins, GitLab CI)?
- ?Czy są dyżury on-call? Jak często?
- ?Jaki jest proces decyzyjny dotyczący architektury?
- ?Jakie są plany rozwoju MLOps w firmie?
- ?Czy praca jest na jednym projekcie długoterminowo, czy możliwa rotacja?
- −Wielkość zespołu
- −Opis konkretnego projektu
- −Narzędzia CI/CD
- −Istnienie dyżurów on-call
- −Ścieżka kariery i benefity poza B2B
Międzynarodowe środowisko, praca w cross-funkcyjnych zespołach z Data Scientistami i inżynierami. Wymagana współpraca i wpływ na architekturę.
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię PySpark. Pełne statystyki zarobków →