Site Reliability Engineer
Mindbox
Rola Site Reliability Engineer w globalnym zespole DevOps, odpowiedzialna za zapewnienie wysokiej dostępności, wydajności i niezawodności systemów produkcyjnych. Codzienna praca obejmuje automatyzację, obserwowalność (SLI/SLO), reagowanie na incydenty, analizę przyczyn źródłowych oraz udział w architekturze i release'ach. Wymagane jest 5+ lat doświadczenia w SRE lub support produkcyjny, biegłość w Ansible, Jenkins, Prometheus, Grafana, Java/Python/Node.js i SQL. Praca hybrydowa w Krakowie (6 dni w biurze miesięcznie) z dyżurami on-call.
Brakuje: nie podano wielkości zespołu, szczegółów procesu rekrutacyjnego, wynagrodzenia za on-call, ani informacji o chmurze (public/private)..
Rola Site Reliability Engineer w globalnym zespole DevOps, odpowiedzialna za zapewnienie wysokiej dostępności, wydajności i niezawodności systemów produkcyjnych. Codzienna praca obejmuje automatyzację, obserwowalność (SLI/SLO), reagowanie na incydenty, analizę przyczyn źródłowych oraz udział w architekturze i release'ach. Wymagane jest 5+ lat doświadczenia w SRE lub support produkcyjny, biegłość w Ansible, Jenkins, Prometheus, Grafana, Java/Python/Node.js i SQL. Praca hybrydowa w Krakowie (6 dni w biurze miesięcznie) z dyżurami on-call.
- ✓Konkretna liczba dni w biurze (6/miesiąc) zapewnia przewidywalność
- ✓Elastyczny model współpracy (B2B lub UoP)
- ✓Dostęp do platform szkoleniowych
- !Poziom 'regular' przy wymaganiu 5+ lat doświadczenia (może sugerować niedoszacowanie seniority)
- !Model outsourcingu może wiązać się z pracą u klienta
- !Brak szczegółów procesu rekrutacyjnego
- •Acting as SRE for global production services, ensuring reliability, security, and availability
- •Implementing SRE practices to enhance uptime, performance, and transparency
- •Monitoring and maintaining SLIs and SLOs, building observability dashboards and incident reporting
- •Performing root cause analysis, leading post-incident reviews, implementing preventive measures
- •Driving automation initiatives and self-service capabilities to reduce manual intervention
- •Participating in architecture discussions, software release planning, and lifecycle activities (SDLC)
- •Supporting and orchestrating infrastructure migrations, DR exercises, and product upgrades
- •Providing on-call production support within a scheduled rotation, including occasional weekend maintenance
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Osoba z 5 latami w SRE lub support produkcyjny, znająca podstawy Ansible, Jenkins, Prometheus, Grafana, i jeden język programowania, gotowa do szybkiego dokształcenia.
Nie dla osób z mniej niż 5 latami doświadczenia w SRE lub production support, ani dla osób nieakceptujących dyżurów on-call w rotacji.
- ?Jak wygląda rotacja dyżurów on-call? Ilu inżynierów w zespole?
- ?Czy jest dodatkowe wynagrodzenie za dyżury?
- ?Jaki jest główny stack technologiczny projektu?
- ?Czy praca jest na jednym projekcie, czy rotacja między klientami?
- ?Jakie są możliwości rozwojowe i ścieżka kariery?
- ?Czy istnieje budżet na certyfikacje lub konferencje?
- −Nie podano wielkości zespołu, szczegółów procesu rekrutacyjnego, wynagrodzenia za on-call, ani informacji o chmurze (public/private).
Collaborative team culture with experienced professionals and access to training platforms.
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię SRE. Pełne statystyki zarobków →