Staff/Senior Machine Learning Engineer
VirtusLab
Rola polega na produkcjonizacji i skalowaniu systemu ML o nazwie Anomalsky na GCP, który wykrywa anomalie semantyczne na poziomie wierszy w danych B2B. Będziesz odpowiedzialny za wdrożenie, utrzymanie i rozwój pipeline'ów ML/LLM z pętlą human-in-the-loop, integrację z istniejącymi procesami akwizycji danych oraz budowę wariantu czasu rzeczywistego. To stanowisko łączy inżynierię ML z MLOps – wymaga pracy z Airflow, Spark, Kubernetes i chmurą GCP, a także współpracy z data scientistami i inżynierami danych klienta.
Brakuje: nie podano wielkości zespołu ani proporcji między inżynierami virtuslab a klienta, brak opisu procesu rekrutacyjnego (liczba etapów, zadanie domowe, live coding).
Rola polega na produkcjonizacji i skalowaniu systemu ML o nazwie Anomalsky na GCP, który wykrywa anomalie semantyczne na poziomie wierszy w danych B2B. Będziesz odpowiedzialny za wdrożenie, utrzymanie i rozwój pipeline'ów ML/LLM z pętlą human-in-the-loop, integrację z istniejącymi procesami akwizycji danych oraz budowę wariantu czasu rzeczywistego. To stanowisko łączy inżynierię ML z MLOps – wymaga pracy z Airflow, Spark, Kubernetes i chmurą GCP, a także współpracy z data scientistami i inżynierami danych klienta.
- ✓Praca nad innowacyjnym systemem ML/LLM od MVP do pełnoskalowego wdrożenia
- ✓Możliwość kształtowania kultury technicznej organizacji i wpływ na architekturę
- ✓Stack technologiczny obejmuje nowoczesne narzędzia (LLM, unsupervised learning, Databricks, Iceberg)
- !Długa lista technologii w stacku może budzić obawy o realistyczność wymagań, choć ogłoszenie zaznacza, że nie wszystkie są niezbędne
- !Projekt realizowany dla klienta zewnętrznego – możliwe częste zmiany priorytetów i konieczność dostosowania się do procesów klienta
- !System w fazie MVP – ryzyko związane z nieprzewidzianymi wyzwaniami przy skalowaniu
- •Produkcjonizacja i skalowanie systemu Anomalsky na GCP
- •Pisanie i utrzymanie kodu Python dla pipeline'ów ML/LLM
- •Zarządzanie przepływami pracy w Airflow i optymalizacja zadań Spark (Dataproc)
- •Wdrażanie modeli unsupervised anomaly detection i LLM-based reasoning w produkcji
- •Projektowanie i implementacja pętli human-in-the-loop oraz mechanizmów uczenia się z feedbacku
- •Integracja systemu z istniejącymi pipeline'ami akwizycji danych (Acquisition)
- •Prototypowanie niskolatencyjnego wariantu czasu rzeczywistego
- •Konteneryzacja i orkiestracja przy użyciu Docker i Kubernetes
Oferta dla doświadczonych specjalistów (Senior).
Doświadczony inżynier ML z 5 latami pracy, solidnymi podstawami Pythona i znajomością Airflow oraz Spark. Może mieć mniejsze doświadczenie z GCP i Kubernetes, ale chęć szybkiego rozwoju w tych obszarach. Osoba, która radzi sobie z wdrażaniem projektów w chmurze i potrafi pracować w zespole projektowym.
Juniorzy i mid-level bez praktycznego doświadczenia w produkcjonizacji ML oraz bez znajomości infrastruktury chmurowej. Rola wymaga samodzielności w skalowaniu systemów i podejmowania decyzji architektonicznych.
- ?Ile osób liczy zespół ML i data engineering po stronie VirtusLab i klienta?
- ?Jak wygląda współpraca z data scientistami – czy są w tym samym zespole, czy w osobnym?
- ?Czy przewidziane są dyżury on-call dla systemów produkcyjnych?
- ?Jaki jest planowany harmonogram skalowania systemu na całą organizację?
- ?Czy istnieje budżet na szkolenia i konferencje?
- ?Jak wygląda proces decyzyjny dotyczący wyboru narzędzi i architektury?
- ?Czy praca jest w pełni zdalna, czy są oczekiwane wizyty w biurze w Krakowie?
- −Nie podano wielkości zespołu ani proporcji między inżynierami VirtusLab a klienta
- −Brak opisu procesu rekrutacyjnego (liczba etapów, zadanie domowe, live coding)
- −Nie wiadomo, czy istnieje możliwość pracy zdalnej w pełni, czy wymagana jest obecność hybrydowa (ogłoszenie wspomina elastyczną pracę hybrydową, ale dane strukturalne wskazują remote)
- −Brak informacji o on-call, budżecie szkoleniowym i urlopach na B2B
Kultura oparta na silnym inżynierii, poczuciu własności i transparentności. Zespół składa się z inżynierów ML i data z VirtusLab współpracujących z inżynierami danych klienta.
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →