Senior Machine Learning - LLM Systems Engineer (f/m/x)

Sii

Oferta w skrócie

Widełki nieujawnione

🏢StacjonarnaTryb pracy

📄Umowa o pracęKontrakt

⏱️Senior · 5+ latDoświadczenie

LokalizacjaPiła

Źródło

Pracuj.pl

↗

Aktywna

Opublikowano26 maja 2026

Ostatnio sprawdzono26 maja 2026

Wygasa za5 dni

Otwórz ofertę u źródła

Werdykt JobHunt

To rola inżyniera systemowego odpowiedzialnego za skalowanie i optymalizację dużych modeli językowych (LLM) w środowisku produkcyjnym. Praca obejmuje projektowanie i utrzymanie rozproszonych systemów treningu i inferencji, profilowanie wydajności na rzeczywistym sprzęcie oraz identyfikację wąskich gardeł. Nie chodzi o tworzenie nowych modeli, ale o sprawienie, by istniejące działały wydajnie na wielu węzłach i akceleratorach.

Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.

Brakuje: nie podano wielkości zespołu, brak opisu konkretnego projektu lub klienta.

🛠 Wymagane technologie

Dane źródłowe

Python C++CUDADistributed ML Systems

AI Insights

Czym naprawdę jest ta rola?AI Inference Platform Engineer

Plusy

✓Profit sharing – ponad 76 mln PLN wypłacone pracownikom od 2022
✓Możliwość zmiany projektów za pomocą aplikacji Job Changer
✓Budżet 1 mln PLN rocznie na pomysły pracowników
✓Inwestycja w rozwój: meetupy, webinary, platforma szkoleniowa

Na co uważać

−Firma outsourcingowa (Sii) – możliwa praca przy projektach klientów, co może wiązać się z mniejszą stabilnością i interesującymi zadaniami
−Brak informacji o dyżurach on-call
−Rekrutacja 4-etapowa opisana ogólnikowo, bez konkretów technicznych

!Niejasna wielkość zespołu i konkretny projekt
!Wielokrotne tytuły 'Great Place to Work' – mogą być marketingowe

?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji

Codzienna praca

•Skalowanie modeli LLM na klastrach multi-node i multi-accelerator
•Optymalizacja opóźnień i przepustowości inferencji poprzez tuning serwerów modeli
•Profilowanie i benchmarkowanie obciążeń ML na GPU/akceleratorach
•Identyfikacja i rozwiązywanie wąskich gardeł na poziomie systemu (pamięć, I/O, komunikacja)
•Projektowanie rozproszonych pipeline'ów treningowych dla wielu GPU/węzłów
•Pisanie niskopoziomowych optymalizacji w C++/CUDA dla wydajności
•Współpraca z zespołami data science i infrastruktury
•Utrzymanie i monitoring produkcyjnych systemów ML/LLM

Więcej o ofercie

Dla kogo jest ta oferta

Profil idealny

Oferta dla doświadczonych specjalistów (Senior).

Minimum sensowne

Senior inżynier z co najmniej 5 latami w ML, z podstawowym doświadczeniem w systemach rozproszonych i niskopoziomowych optymalizacjach, gotowy do dalszego rozwoju w kierunku systemów LLM.

Raczej nie dla

Nie dla juniorów ani mid-level bez specjalistycznego doświadczenia w rozproszonych systemach ML i optymalizacjach niskopoziomowych. Nie dla data scientistów skupionych na budowie modeli, a nie na infrastrukturze.

Ocena dopasowania

Junior1/5

Mid2/5

Senior5/5

Hands-on5/5

Architekt2/5

Remote1/5

Enterprise3/5

Pytania do rekrutera

?Ile osób liczy zespół pracujący nad systemami LLM?
?Czy konkretnie jakieś projekty są już realizowane, czy to nowa inicjatywa?
?Jak wygląda bilans między pracą nad nowymi systemami a utrzymaniem istniejących?
?Czy są dyżury on-call? Jak często?
?Jakie są możliwości awansu i rozwoju w strukturze Sii?
?Czy używacie konkretnych frameworków do rozproszonego treningu (np. PyTorch Distributed, DeepSpeed)?

Brakujące informacje

−Nie podano wielkości zespołu
−Brak opisu konkretnego projektu lub klienta
−Nie wiadomo, czy praca jest na jednym projekcie, czy rotacyjna
−Brak informacji o dyżurach on-call
−Nie określono, jakie akceleratory są używane (GPU, TPU, itp.)

Zespół

Firma deklaruje przyjazne środowisko (Great Place to Work) i inwestuje w rozwój, ale jako outsourcing może mieć zróżnicowaną kulturę w zależności od projektu.

Rekrutacja

4 etapy: (1) wysłanie CV, (2) rozmowa o oczekiwaniach, (3) poznanie projektów i wybór najlepszego, (4) rozpoczęcie współpracy. Brak szczegółów technicznych ani zadań rekrutacyjnych.

Powiązane strony

Praca Python →Zarobki Python →Praca Python Piła →

🔗Podobne oferty