Senior Site Reliability Engineer
Webellian
Rola SRE w zespole Advanced Analytics – odpowiadasz za niezawodność platformy, która obsługuje AI, backend Java i frontend. Definiujesz SLO i SLI, reagujesz na awarie na poziomie infrastruktury (Kubernetes, Azure), automatyzujesz żmudne zadania oraz utrzymujesz monitoring (Prometheus, Grafana). To stanowisko operacyjne z dyżurami on-call i bliską współpracą z platform engineerami oraz security engineerami.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: rotacja on-call i ewentualna rekompensata, wielkość zespołu sre/infra.
Rola SRE w zespole Advanced Analytics – odpowiadasz za niezawodność platformy, która obsługuje AI, backend Java i frontend. Definiujesz SLO i SLI, reagujesz na awarie na poziomie infrastruktury (Kubernetes, Azure), automatyzujesz żmudne zadania oraz utrzymujesz monitoring (Prometheus, Grafana). To stanowisko operacyjne z dyżurami on-call i bliską współpracą z platform engineerami oraz security engineerami.
- ✓Praca z nowoczesnym stackiem (Kubernetes, Terraform, Azure, ArgoCD)
- ✓Międzynarodowy zespół i nacisk na wysoką jakość kodu
- ✓Możliwość rozwoju i nauki (budżet na szkolenia? – nie sprecyzowane, ale kultura sprzyja)
- !Nie podano widełek wynagrodzenia
- !Hybryda: minimum 1 dzień w biurze – może być więcej, brak konkretów
- !Brak informacji o rotacji on-call i ewentualnym dodatkowym wynagrodzeniu za dyżury
- !Firma konsultingowa – projekty mogą się zmieniać, co wpływa na stabilność pracy
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Definiowanie i utrzymanie SLO oraz SLI dla komponentów platformy
- •Pełnienie dyżurów on-call jako drugi poziom eskalacji infrastrukturalnej
- •Zarządzanie klastrami Kubernetes (AKS): networking, autoscaling, multi-tenancy
- •Pisanie i utrzymywanie kodu Terraform do provisionowania zasobów Azure
- •Tworzenie dashboardów i alertów w Prometheus/Grafana oraz Azure Monitor
- •Przeprowadzanie capacity planning i optymalizacja kosztów zasobów
- •Automatyzacja powtarzalnych zadań operacyjnych (Python/bash)
- •Udział w blameless post-incident reviews i tworzenie runbooków
Oferta dla doświadczonych specjalistów (Senior).
Inżynier z 5-letnim stażem w DevOps/Platform Engineering, solidnie znający Kubernetes i Terraform, ale z mniejszym doświadczeniem w Azure lub zaawansowanym monitoringu. Osoba ta musi wykazać się umiejętnością szybkiego uczenia się i gotowością do pracy w trybie on-call.
Juniorzy bez doświadczenia w produkcji. Osoby szukające w pełni zdalnej pracy (wymagany hybrydowy w Warszawie co najmniej 1 dzień w tygodniu). Kandydaci niechętni do dyżurów on-call.
- ?Ile osób liczy zespół Infra, w którym będę pracować?
- ?Jak wygląda konkretny harmonogram dyżurów on-call? Czy jest dodatkowe wynagrodzenie?
- ?Czy obowiązkowe jest 1 dzień w biurze, czy może być więcej? Jak elastyczne są godziny?
- ?Jaki jest budżet na szkolenia i certyfikacje (np. CKA)?
- ?Czy platforma jest budowana od zera, czy istnieje już legacy?
- ?Jak wygląda proces rekrutacji – ile etapów, czy jest zadanie domowe?
- −Rotacja on-call i ewentualna rekompensata
- −Wielkość zespołu SRE/Infra
- −Konkretny stos technologiczny w projektach klienckich (czy to wewnętrzna platforma czy klient?)
- −Proces rekrutacyjny – liczba etapów, rodzaj zadań
Międzynarodowy zespół inżynierów i senior advisorów, kładący nacisk na wysoką jakość kodu, dzielenie się wiedzą i unikanie polityki. Atmosfera sprzyja uczeniu się – dostępne są nowe technologie, a w biurze są udogodnienia jak pinball czy PlayStation.