Lead Linux System Administrator
ALTER GPU CENTER
Jako Lead Linux System Administrator będziesz odpowiadać za infrastrukturę Linux obsługującą klastry GPU używane do trenowania i uruchamiania modeli AI. Rola łączy praktyczną administrację (konfiguracja serwerów, zarządzanie sterownikami NVIDIA, automatyzacja) z przywództwem technicznym (mentoring zespołu administratorów). Pracujesz w międzynarodowym zespole, wspierając środowiska HPC/AI na dużą skalę.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: widełki wynagrodzenia, szczegóły dotyczące dyżurów on-call (częstotliwość, wynagrodzenie).
Jako Lead Linux System Administrator będziesz odpowiadać za infrastrukturę Linux obsługującą klastry GPU używane do trenowania i uruchamiania modeli AI. Rola łączy praktyczną administrację (konfiguracja serwerów, zarządzanie sterownikami NVIDIA, automatyzacja) z przywództwem technicznym (mentoring zespołu administratorów). Pracujesz w międzynarodowym zespole, wspierając środowiska HPC/AI na dużą skalę.
- ✓Kontrakt B2B
- ✓Odpowiedzialność za nowoczesną infrastrukturę GPU/AI – atrakcyjna technologicznie
- ✓Możliwość rozwoju zarówno technicznego, jak i przywódczego
- ✓Międzynarodowy zespół i współpraca z doświadczonymi inżynierami
- !Brak widełek wynagrodzenia
- !Dyżury on-call bez doprecyzowania wynagrodzenia lub czasu dyżuru
- !Nie podano wielkości zespołu ani liczby obsługiwanych serwerów
- !Ogólne sformułowania o 'dynamicznym środowisku' bez konkretów
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Zarządzanie cyklem życia serwerów Linux: provisioning, patching, hardening, konfiguracja i monitorowanie wydajności
- •Utrzymanie i optymalizacja stosu NVIDIA GPU (sterowniki, CUDA, cuDNN, NCCL) oraz narzędzi zarządzania GPU (DCGM, nvidia-smi)
- •Automatyzacja provisioning'u i konfiguracji serwerów za pomocą Ansible, Terraform i skryptów Python/Bash
- •Tuning systemu Linux dla obciążeń GPU: parametry jądra, systemy plików, sieci (InfiniBand/RoCE), kolejkowanie zadań
- •Diagnozowanie i rozwiązywanie złożonych problemów na poziomie sprzętu, sterowników, OS i usług klastrowych
- •Współpraca z zespołami DevOps/SRE, operacyjnymi i AI/ML w celu integracji infrastruktury OS z platformami orkiestracyjnymi
- •Udział w dyżurach on-call oraz ciągłe ulepszanie niezawodności i wydajności infrastruktury
- •Mentoring i wsparcie techniczne dla zespołu administratorów Linux
Stanowisko liderskie — wymaga zarówno doświadczenia technicznego jak i umiejętności zarządzania.
Administrator Linux z 7+ latami doświadczenia i przynajmniej podstawową znajomością GPU NVIDIA, który ma doświadczenie w automatyzacji (Ansible, Python) i chęci do rozwoju w kierunku lidera technicznego.
Juniorzy lub osoby bez doświadczenia w administracji Linux na dużą skalę. Kandydaci unikający obowiązków on-call lub preferujący wyłącznie pracę deweloperską bez kontaktu ze sprzętem i niskopoziomową optymalizacją.
- ?Jak często odbywają się dyżury on-call i czy są dodatkowo płatne?
- ?Ile osób liczy zespół administratorów, którym będę zarządzał?
- ?Jaka jest aktualna flota serwerów (modele GPU, liczba węzłów)?
- ?Czy istnieje możliwość udziału w konferencjach lub szkoleniach?
- ?Jaki jest podział czasu między pracą rąk (hands-on) a zarządzaniem zespołem?
- ?Czy firma planuje rozwój w kierunku większej automatyzacji (np. orkiestracja Kubernetes)?
- −Widełki wynagrodzenia
- −Szczegóły dotyczące dyżurów on-call (częstotliwość, wynagrodzenie)
- −Liczebność zespołu i liczba obsługiwanych serwerów
- −Konkretny model GPU używany w infrastrukturze
- −Dodatkowe benefity poza 'pakietem benefitów'
Międzynarodowy, dynamiczny zespół z naciskiem na współpracę inżynierów infrastruktury, platform i AI. Oczekuje się dużej samodzielności i odpowiedzialności.