Site Operations Manager
ALTER GPU CENTER
Rola polega na zarządzaniu codzienną operacją nowoczesnego data center wyposażonego w infrastrukturę GPU do obciążeń AI. Obejmuje nadzór nad zespołem techników i inżynierów, utrzymanie krytycznej infrastruktury (zasilanie, chłodzenie, sieci), monitorowanie wskaźników wydajności (PUE, WUE), prowadzenie reakcji na incydenty oraz współpracę z zespołami DevOps/SRE i AI/ML. To stanowisko operacyjno-menedżerskie, nieinżynierskie.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: brak informacji o wysokości wynagrodzenia, nie podano wielkości zespołu ani struktury raportowania.
Rola polega na zarządzaniu codzienną operacją nowoczesnego data center wyposażonego w infrastrukturę GPU do obciążeń AI. Obejmuje nadzór nad zespołem techników i inżynierów, utrzymanie krytycznej infrastruktury (zasilanie, chłodzenie, sieci), monitorowanie wskaźników wydajności (PUE, WUE), prowadzenie reakcji na incydenty oraz współpracę z zespołami DevOps/SRE i AI/ML. To stanowisko operacyjno-menedżerskie, nieinżynierskie.
- ✓Możliwość zarządzania nowoczesnym, wysokowydajnym data center dla AI
- ✓Realny wpływ na niezawodność i efektywność infrastruktury AI
- ✓Współpraca z doświadczonymi zespołami infra, inżynierii i operacji
- ✓Dynamiczne środowisko z przestrzenią na własność procesów i rozwój
- !Brak informacji o wynagrodzeniu i szczegółach pakietu benefitów
- !Nieokreślona częstotliwość dyżurów on-call i ewentualne dodatki za nie
- !Firma o wielkości 1-10 osób – możliwy chaos organizacyjny i brak procesów
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Kierowanie 24/7 zespołem operacyjnym (technicy, inżynierowie) i organizacja zmian
- •Nadzór nad konserwacją prewencyjną i naprawczą systemów elektrycznych i mechanicznych (UPS, generatory, PDU, chłodzenie, gaszenie)
- •Monitorowanie i optymalizacja wskaźników efektywności energetycznej (PUE, WUE)
- •Prowadzenie procesu reagowania na incydenty, analizy przyczyn źródłowych i działań poincydentnych
- •Współpraca z DevOps/SRE, sieciowcami i zespołami AI/ML przy wdrożeniach sprzętu i oknach serwisowych
- •Zarządzanie relacjami z zewnętrznymi dostawcami i wykonawcami, kontrola SLA i rozliczeń
- •Kontrola budżetu operacyjnego i identyfikacja oszczędności oraz usprawnień procesowych
- •Zapewnienie zgodności z normami bezpieczeństwa, przepisami środowiskowymi i procedurami wewnętrznymi
Stanowisko liderskie — wymaga zarówno doświadczenia technicznego jak i umiejętności zarządzania.
Menedżer operacyjny z minimum 8-letnim doświadczeniem w data center, w tym 4 lata w roli kierowniczej, który zna podstawy infrastruktury krytycznej i potrafi zarządzać zespołem 24/7. Może nie mieć jeszcze doświadczenia w środowiskach GPU/AI, ale wykazuje gotowość do szybkiego uczenia się.
Osoby bez doświadczenia w zarządzaniu operacjami data center, juniorscy administratorzy, czysto zdalni pracownicy bez chęci uczestnictwa w dyżurach on-call, ani osoby szukające pracy wyłącznie programistycznej.
- ?Jak wygląda rotacja dyżurów on-call i czy jest dodatkowo płatna?
- ?Ile osób liczy obecny zespół operacyjny i jakie są role?
- ?Jakie są główne wyzwania operacyjne w obecnym obiekcie?
- ?Jaki jest budżet operacyjny i czy mam wpływ na jego kształtowanie?
- ?Czy firma planuje rozwój w kierunku hyperscale lub kolejnych lokalizacji?
- ?Jakie narzędzia DCIM/BMS są obecnie używane i czy planowane są zmiany?
- −Brak informacji o wysokości wynagrodzenia
- −Nie podano wielkości zespołu ani struktury raportowania
- −Brak szczegółów dotyczących procesu rekrutacyjnego (etapy, czas)
- −Nie wiadomo, czy istnieje budżet na szkolenia i certyfikacje
- −Nie określono, czy dyżury on-call są dodatkowo wynagradzane
Mały, dynamiczny zespół w startupie, z naciskiem na współpracę międzyoperacyjną i realny wpływ. Praca w środowisku wymagającym, ale dającym dużo autonomii i przestrzeni na rozwój.