Data Engineer/Fullstack AI (Systemy ML)
4IT Solutions
Rola łączy data engineering z ML/AI production. Głównym zadaniem jest budowa end-to-end platformy AI, która automatyzuje analizę i przetwarzanie danych z wielu źródeł. Inżynier odpowiada za cały pipeline: od pozyskania i przetworzenia danych (w tym nieustrukturyzowanych), przez trenowanie i wdrażanie modeli ML/NLP/CV, aż po deploy API i monitoring w chmurze. To rola o dużej odpowiedzialności, wymagająca szerokiego wachlarza umiejętności – od data engineeringu po MLOps i tworzenie mikroserwisów.
Brakuje: nie podano wielkości zespołu projektowego, brak informacji o konkretnej branży klienta.
Rola łączy data engineering z ML/AI production. Głównym zadaniem jest budowa end-to-end platformy AI, która automatyzuje analizę i przetwarzanie danych z wielu źródeł. Inżynier odpowiada za cały pipeline: od pozyskania i przetworzenia danych (w tym nieustrukturyzowanych), przez trenowanie i wdrażanie modeli ML/NLP/CV, aż po deploy API i monitoring w chmurze. To rola o dużej odpowiedzialności, wymagająca szerokiego wachlarza umiejętności – od data engineeringu po MLOps i tworzenie mikroserwisów.
- ✓Możliwość rozwoju zawodowego i awansu
- ✓Otwartość na inicjatywy pracowników
- −Ogłoszenie sugeruje pracę na konkretnym projekcie, ale później stwierdza 'nie szukamy do pracy na konkretnym projekcie' – brak spójności.
- −Bardzo szeroki zakres obowiązków (od data engineering przez ML po API) – ryzyko bycia 'złotą rączką'.
- −Firma 4IT Solutions to agencja zatrudniająca 1-10 osób – potencjalnie mała stabilność i ograniczone zasoby.
- !Brak informacji o wielkości zespołu i strukturze organizacyjnej.
- !Nie określono konkretnej chmury (AWS/GCP/Azure) – kandydat musi być elastyczny.
- !Opis wymagań technicznych jest bardzo obszerny – może to oznaczać oczekiwanie eksperta we wszystkich dziedzinach.
- •Projektowanie i implementacja pipeline'ów ETL/ELT dla danych z różnych źródeł (bazy, API, scraping, pliki)
- •Przetwarzanie danych nieustrukturyzowanych (PDF, HTML, obrazy) z użyciem OCR, NLP, regex
- •Budowa i fine-tuning modeli ML (NLP, computer vision, time-series) z użyciem PyTorch/TensorFlow
- •Tworzenie API REST (FastAPI/Flask) do serwowania modeli w produkcji
- •Konteneryzacja aplikacji (Docker) i wdrażanie w chmurze (AWS/GCP/Azure)
- •Implementacja RAG, embeddingów i ewaluacja modeli
- •Optymalizacja wydajności pipeline'ów i modeli (batch processing, Spark)
- •Monitorowanie i utrzymanie systemów ML w produkcji
Oferta odpowiednia dla osób na początku kariery w IT.
Mid-level inżynier z co najmniej 3 latami doświadczenia w data engineeringu i ML, który potrafi samodzielnie zbudować pipeline danych i wdrożyć model w produkcji, choć może potrzebować wsparcia w bardziej zaawansowanych obszarach (np. fine-tuning LLM).
Junior bez doświadczenia w produkcji ML – zakres wymagań jest zbyt szeroki. Osoby szukające wąsko wyspecjalizowanej roli (np. tylko data engineering) również nie będą usatysfakcjonowane.
- ?Ile osób liczy zespół, w którym będę pracować? Jakie są role pozostałych członków?
- ?Czy klient preferuje konkretną chmurę (AWS, GCP, Azure) czy jest to wybór dowolny?
- ?Jak wygląda równowaga między data engineeringiem a pracą nad modelami ML? Czy jest to 50/50, czy jedna część dominuje?
- ?Czy w projekcie korzystamy z istniejących modeli, czy głównie rozwijamy własne?
- ?Jaki jest poziom skomplikowania danych wejściowych? Czy są już ustrukturyzowane, czy w pełni surowe?
- ?Czy przewidziano dyżury on-call lub wsparcie produkcyjne po godzinach?
- ?Jakie narzędzia do orchestracji pipeline'ów są używane? (Airflow, Prefect, inne?)
- ?Czy istnieje możliwość pracy w trybie hybrydowym, czy tylko zdalnie?
- −Nie podano wielkości zespołu projektowego
- −Brak informacji o konkretnej branży klienta
- −Nie wiadomo, jaki jest poziom wsparcia ze strony innych inżynierów (czy rola jest solo, czy w zespole)
- −Nie określono, czy istnieje budżet szkoleniowy lub konferencyjny
- −Brak szczegółów o monitoringu i alertingu w produkcji
Wstępna rozmowa telefoniczna z przedstawicielem 4IT Solutions, następnie zdalna rozmowa techniczna z Klientem.
Powyżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →