Senior Machine Learning - LLM Systems Engineer (f/m/x)
Sii
To rola inżyniera systemowego odpowiedzialnego za skalowanie i optymalizację dużych modeli językowych (LLM) w środowisku produkcyjnym. Praca obejmuje projektowanie i utrzymanie rozproszonych systemów treningu i inferencji, profilowanie wydajności na rzeczywistym sprzęcie oraz identyfikację wąskich gardeł. Nie chodzi o tworzenie nowych modeli, ale o sprawienie, by istniejące działały wydajnie na wielu węzłach i akceleratorach.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: nie podano wielkości zespołu, brak opisu konkretnego projektu lub klienta.
To rola inżyniera systemowego odpowiedzialnego za skalowanie i optymalizację dużych modeli językowych (LLM) w środowisku produkcyjnym. Praca obejmuje projektowanie i utrzymanie rozproszonych systemów treningu i inferencji, profilowanie wydajności na rzeczywistym sprzęcie oraz identyfikację wąskich gardeł. Nie chodzi o tworzenie nowych modeli, ale o sprawienie, by istniejące działały wydajnie na wielu węzłach i akceleratorach.
- ✓Profit sharing – ponad 76 mln PLN wypłacone pracownikom od 2022
- ✓Możliwość zmiany projektów za pomocą aplikacji Job Changer
- ✓Budżet 1 mln PLN rocznie na pomysły pracowników
- ✓Inwestycja w rozwój: meetupy, webinary, platforma szkoleniowa
- −Firma outsourcingowa (Sii) – możliwa praca przy projektach klientów, co może wiązać się z mniejszą stabilnością i interesującymi zadaniami
- −Brak informacji o dyżurach on-call
- −Rekrutacja 4-etapowa opisana ogólnikowo, bez konkretów technicznych
- !Niejasna wielkość zespołu i konkretny projekt
- !Wielokrotne tytuły 'Great Place to Work' – mogą być marketingowe
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Skalowanie modeli LLM na klastrach multi-node i multi-accelerator
- •Optymalizacja opóźnień i przepustowości inferencji poprzez tuning serwerów modeli
- •Profilowanie i benchmarkowanie obciążeń ML na GPU/akceleratorach
- •Identyfikacja i rozwiązywanie wąskich gardeł na poziomie systemu (pamięć, I/O, komunikacja)
- •Projektowanie rozproszonych pipeline'ów treningowych dla wielu GPU/węzłów
- •Pisanie niskopoziomowych optymalizacji w C++/CUDA dla wydajności
- •Współpraca z zespołami data science i infrastruktury
- •Utrzymanie i monitoring produkcyjnych systemów ML/LLM
Oferta dla doświadczonych specjalistów (Senior).
Senior inżynier z co najmniej 5 latami w ML, z podstawowym doświadczeniem w systemach rozproszonych i niskopoziomowych optymalizacjach, gotowy do dalszego rozwoju w kierunku systemów LLM.
Nie dla juniorów ani mid-level bez specjalistycznego doświadczenia w rozproszonych systemach ML i optymalizacjach niskopoziomowych. Nie dla data scientistów skupionych na budowie modeli, a nie na infrastrukturze.
- ?Ile osób liczy zespół pracujący nad systemami LLM?
- ?Czy konkretnie jakieś projekty są już realizowane, czy to nowa inicjatywa?
- ?Jak wygląda bilans między pracą nad nowymi systemami a utrzymaniem istniejących?
- ?Czy są dyżury on-call? Jak często?
- ?Jakie są możliwości awansu i rozwoju w strukturze Sii?
- ?Czy używacie konkretnych frameworków do rozproszonego treningu (np. PyTorch Distributed, DeepSpeed)?
- −Nie podano wielkości zespołu
- −Brak opisu konkretnego projektu lub klienta
- −Nie wiadomo, czy praca jest na jednym projekcie, czy rotacyjna
- −Brak informacji o dyżurach on-call
- −Nie określono, jakie akceleratory są używane (GPU, TPU, itp.)
Firma deklaruje przyjazne środowisko (Great Place to Work) i inwestuje w rozwój, ale jako outsourcing może mieć zróżnicowaną kulturę w zależności od projektu.
4 etapy: (1) wysłanie CV, (2) rozmowa o oczekiwaniach, (3) poznanie projektów i wybór najlepszego, (4) rozpoczęcie współpracy. Brak szczegółów technicznych ani zadań rekrutacyjnych.