Data/MLOps Engineer
co.brick
To rola MLOps/Data Engineer w firmie działającej w branży AI, gdzie będziesz odpowiedzialny za wdrażanie modeli ML do produkcji i budowę skalowalnych potoków danych. Realnie zajmiesz się automatyzacją uczenia, deploymentem modeli, zarządzaniem infrastrukturą chmurową na AWS (głównie SageMaker) oraz budową pipeline'ów ETL w PySpark i Apache Spark. Będziesz współpracować z Data Scientistami, którzy dostarczają notebooki, a Ty zamienisz je na produkcyjne rozwiązania. Rola wymaga łączenia wiedzy inżynierskiej z ML.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: nie podano wielkości zespołu, brak opisu procesu rekrutacyjnego.
To rola MLOps/Data Engineer w firmie działającej w branży AI, gdzie będziesz odpowiedzialny za wdrażanie modeli ML do produkcji i budowę skalowalnych potoków danych. Realnie zajmiesz się automatyzacją uczenia, deploymentem modeli, zarządzaniem infrastrukturą chmurową na AWS (głównie SageMaker) oraz budową pipeline'ów ETL w PySpark i Apache Spark. Będziesz współpracować z Data Scientistami, którzy dostarczają notebooki, a Ty zamienisz je na produkcyjne rozwiązania. Rola wymaga łączenia wiedzy inżynierskiej z ML.
- ✓Stawka 140-150 zł/h na B2B to bardzo atrakcyjny widełki dla seniora
- ✓Praca w pełni zdalna
- ✓Nowoczesny stack technologiczny (AWS SageMaker, PySpark, IaC)
- −Agencja rekrutacyjna – realny klient nie jest ujawniony, co może wiązać się z niską stabilnością
- −Brak informacji o zespole i podziale odpowiedzialności między Data Engineering a MLOps
- !Rola może być szeroka – łączy MLOps z Data Engineering, co może oznaczać przeciążenie obowiązkami
- !Nie podano informacji o dyżurach on-call ani monitoringu 24/7
- !Start ASAP może sugerować pilną potrzebę i dużą presję czasową
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie i utrzymanie end-to-end lifecycle'u ML (automatyczne trenowanie, deployment, wersjonowanie)
- •Budowa i zarządzanie Feature Store, eksperyment trackingiem i rejestrem modeli
- •Implementacja pipeline'ów CI/CD/CT dla modeli ML
- •Tworzenie wydajnych potoków ingestii i przetwarzania danych w PySpark i Apache Spark
- •Optymalizacja modeli danych i przechowywania pod kątem niskiego latencji inferencji
- •Monitorowanie dryfu modeli, jakości danych i opóźnień systemowych
- •Pisanie kodu infrastruktury jako kod (IaC) z użyciem AWS CDK, Terraform lub CloudFormation
- •Współpraca z Data Scientistami i Product Ownerami w ramach Agile
Oferta dla doświadczonych specjalistów (Senior).
Minimalnie śr.+ inżynier z 3-4 latami doświadczenia, który ma solidne podstawy PySpark i SageMaker, rozumie proces ML i potrafi samodzielnie zbudować pipeline CI/CD.
Nie dla juniorów ani osób bez produkcyjnego doświadczenia z ML. Jeśli nie miałeś styczności z SageMaker lub nie znasz dobrze PySparka, ta rola jest zbyt wymagająca.
- ?Jaka jest branża klienta końcowego?
- ?Ile osób liczy zespół CT&C Engineering?
- ?Ile modeli ML jest aktualnie w produkcji i jak wygląda proces przejścia z notebooka do produkcji?
- ?Jakie narzędzia są używane do monitorowania dryfu modeli i jakości danych?
- ?Czy przewidziane są dyżury on-call? Jeśli tak, z jaką częstotliwością?
- ?Jaki jest podział obowiązków między Data Engineering a stricte MLOps?
- ?Czy istnieje możliwość wpływu na wybór narzędzi i architektury?
- −Nie podano wielkości zespołu
- −Brak opisu procesu rekrutacyjnego
- −Nie wiadomo, jak wygląda on-call
- −Brak informacji o kliencie końcowym i branży