Inference Platform Engineer (LLM & Kubernetes)

N-iX

🛠 Wymagane technologie

Dane źródłowe

Główne technologie

LLM Inference API OpenAI Linux Anthropic Python

Obszary testów / procesy

Kubernetes

AI Insights

Czym naprawdę jest ta rola?MLOps Engineer

To rola platformowa/infrastrukturalna skupiona na operacjonalizacji inferencji LLM. Będziesz odpowiadać za integrację API inferencyjnych (OpenAI, Anthropic itp.), zarządzanie Kubernetes, monitorowanie wydajności i niezawodności, a także za bezpieczeństwo i zgodność z regulacjami. Praca w modelu współdzielonej odpowiedzialności (1–2 FTE) z dyżurami on-call. Nie będziesz trenować modeli, ale zapewnisz ich stabilne działanie w produkcji.

Plusy

✓Praca w pełni zdalna
✓Kontrakt B2B z konkurencyjnym wynagrodzeniem
✓Praca z nowoczesnym stackiem (Kubernetes, Helm, ArgoCD, LLM)
✓Europejska firma AI przestrzegająca standardów etycznych i regulacyjnych
✓Możliwość wpływu na architekturę platformy inferencyjnej

Na co uważać

−Model współdzielonej odpowiedzialności 1-2 FTE może prowadzić do niejasności w zakresie obowiązków

!Szeroki zakres odpowiedzialności (od API przez K8s po bezpieczeństwo)
!Wymagane tylko 'podstawowa wiedza o LLM' – ryzyko, że kandydat przeceni swoje umiejętności

Codzienna praca

•Integracja i utrzymanie API inferencyjnych dla LLM (OpenAI, Anthropic itp.)
•Zarządzanie wdrożeniami Kubernetes z użyciem Helm i ArgoCD
•Monitorowanie wydajności, opóźnień i dostępności serwisów inferencyjnych
•Diagnozowanie i rozwiązywanie problemów z logami, błędami i incydentami produkcyjnymi
•Projektowanie i utrzymanie obsługi rozmów wieloobrotowych (multi-turn conversation) i szablonów czatów
•Współpraca z zespołami backendowymi, platformowymi i infrastrukturalnymi
•Udział w dyżurach on-call w rotacji
•Pisanie i aktualizacja dokumentacji operacyjnej oraz runbooków

Więcej o ofercie

Dla kogo jest ta oferta

Profil idealny

Oferta dla doświadczonych specjalistów (Senior).

Minimum sensowne

Inżynier z 5+ latami Pythona i solidnym Kubernetes, który miał styczność z LLM APIs i potrafi utrzymać serwis w produkcji. Wymagana znajomość monitorowania i umiejętność pracy w modelu współdzielonej odpowiedzialności.

Raczej nie dla

Juniorzy bez doświadczenia w Kubernetes i produkcji. Osoby szukające pracy wyłącznie developerskiej (czysty kod) – tutaj duży nacisk na operacyjność i infrastrukturę. Ktoś, kto nie chce dyżurować on-call.

Ocena dopasowania

Junior1/5

Mid2/5

Senior5/5

Hands-on5/5

Architekt2/5

Remote5/5

Enterprise3/5

Pytania do rekrutera

?Jak wygląda rotacja dyżurów on-call i czy jest dodatkowo płatna?
?Ile osób liczy zespół i jak dzielą się obowiązkami w modelu 1-2 FTE?
?Czy wymagana jest znajomość Rusta na poziomie produkcyjnym, czy to tylko 'nice to have'?
?Jakie narzędzia do monitorowania i obserwowalności są używane?
?Jaki jest aktualny stan platformy inferencyjnej – czy to greenfield, czy istniejący system?
?Jak wygląda proces onboardingu i czy jest dokumentacja?
?Czy istnieje możliwość rozwoju w kierunku architektury lub tech leada?

Brakujące informacje

−Brak informacji o wielkości zespołu
−Nie podano szczegółów dotyczących klienta (która europejska firma AI)
−Brak opisu procesu rekrutacyjnego
−Nie wiadomo czy są benefity dodatkowe (szkolenia, konferencje)
−Brak informacji o narzędziach monitoringowych (Prometheus, Grafana itp.)

Zespół

Zespół cross-funkcyjny, współpraca z backendem, platformą i infrastrukturą. Kładzie się nacisk na dokumentację i dzielenie się wiedzą w modelu współdzielonej odpowiedzialności.

Oferta w skrócie

21 563 – 29 470PLN / mies.

🏠ZdalnieTryb pracy

📄B2BKontrakt

⏱️Senior · 5+ latDoświadczenie

LokalizacjaKraków

Źródło

justjoinit

Aktywna

Opublikowano9 maja 2026

Ostatnio sprawdzono9 maja 2026

Wygasa za5 dni

Otwórz ofertę u źródła

🔗Podobne oferty