Operations Team Lead
act digital
Rola to hands-on lider zespołu operacyjnego (SRE/Production Engineering), który przejmuje pełną odpowiedzialność za stabilność i niezawodność systemów produkcyjnych. Głównym celem jest przejście od gaszenia pożarów do proaktywnego inżynierowania niezawodności. Obejmuje zarządzanie incydentami, on-call, monitorowanie (SLI/SLO), oraz rozwój zespołu. To stanowisko łączy techniczne przywództwo z pracą operacyjną w środowisku produkcyjnym klientów zewnętrznych (outsourcing IT).
Brakuje: nie podano liczby osób w zespole ani struktury, brak informacji o konkretnym stacku technologicznym (cloud, narzędzia).
Rola to hands-on lider zespołu operacyjnego (SRE/Production Engineering), który przejmuje pełną odpowiedzialność za stabilność i niezawodność systemów produkcyjnych. Głównym celem jest przejście od gaszenia pożarów do proaktywnego inżynierowania niezawodności. Obejmuje zarządzanie incydentami, on-call, monitorowanie (SLI/SLO), oraz rozwój zespołu. To stanowisko łączy techniczne przywództwo z pracą operacyjną w środowisku produkcyjnym klientów zewnętrznych (outsourcing IT).
- ✓Długoterminowy projekt (2+ lata)
- ✓Budżet szkoleniowy 2000 PLN rocznie
- ✓Program relokacyjny
- !Brak informacji o konkretnych technologiach (chmura, narzędzia monitoringowe, Kubernetes itp.)
- !Hybryda z Warszawy – nie podano liczby dni w biurze
- !Firma outsourcingowa – praca u klientów, możliwy wpływ na stabilność projektów
- •Dowodzenie reakcją na incydenty produkcyjne i prowadzenie postmortem bez obwiniania
- •Projektowanie i optymalizacja on-call rotacji oraz runbooków dla zespołu
- •Definiowanie i monitorowanie SLI/SLO dla systemów klientów
- •Przeglądanie zmian produkcyjnych i nadzorowanie release'ów
- •Mentoring i rozwój członków zespołu operacyjnego
- •Analiza trendów incydentów i wdrażanie długoterminowych usprawnień
- •Współpraca z zespołami developerskimi nad poprawą niezawodności
- •Udział w dyżurach on-call (samodzielnie i z zespołem)
Stanowisko liderskie — wymaga zarówno doświadczenia technicznego jak i umiejętności zarządzania.
Inżynier SRE/DevOps z 5-letnim doświadczeniem, który pełnił rolę tech leada lub lidera zespołu operacyjnego, potrafi zarządzać incydentami i rozumie koncepcję SLO. Osoba z angielskim na poziomie umożliwiającym swobodną komunikację międzynarodową.
Osoby bez doświadczenia w zarządzaniu incydentami i dyżurach on-call, juniorzy, specjaliści od wąskich dziedzin (np. tylko monitoring), ani menedżerowie nietechniczni.
- ?Ile osób liczy zespół operacyjny, którym mam kierować?
- ?Jak wygląda obecny system on-call – częstotliwość dyżurów, wsparcie narzędziowe?
- ?Jacy są główni klienci i w jakich technologiach (AWS, Azure, GCP, Kubernetes, monitoring)?
- ?Czy istnieją już zdefiniowane SLO, czy trzeba je stworzyć od zera?
- ?Jaki jest obecny poziom dojrzałości procesów (postmortem, blameless, automation)?
- ?Czy rola wymaga częstych podróży lub wizyt u klientów zagranicznych?
- ?Jakie są kryteria sukcesu w pierwszych 3 i 6 miesiącach?
- ?Czy w firmie istnieje ścieżka rozwoju dla liderów technicznych?
- −Nie podano liczby osób w zespole ani struktury
- −Brak informacji o konkretnym stacku technologicznym (cloud, narzędzia)
- −Nie określono częstotliwości dyżurów on-call
- −Brak opisu procesu rekrutacyjnego (etapy, rozmowy, zadanie)
Powyżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię DevOps. Pełne statystyki zarobków →