Site Reliability Engineer
Pretius
Rola SRE w projekcie z branży finansowej, międzynarodowy zespół. Odpowiadasz za niezawodność aplikacji i pipeline'ów AI od początku do końca. Budujesz centralny 'control tower' do monitorowania i alertowania, projektujesz telemetrię (opóźnienia, przepustowość, błędy), prowadzisz reakcje na incydenty (triage, koordynacja, RCA, post-mortems) oraz redukujesz nawracające problemy przez automatyzację. Poprawiasz jakość CI/CD, współpracujesz z zespołami inżynieryjnymi. Wymagane jest aktywne korzystanie z narzędzi AI (LLM, Copilot) w codziennej pracy.
Brakuje: brak informacji o wielkości zespołu, nie opisano procesu rekrutacyjnego.
Rola SRE w projekcie z branży finansowej, międzynarodowy zespół. Odpowiadasz za niezawodność aplikacji i pipeline'ów AI od początku do końca. Budujesz centralny 'control tower' do monitorowania i alertowania, projektujesz telemetrię (opóźnienia, przepustowość, błędy), prowadzisz reakcje na incydenty (triage, koordynacja, RCA, post-mortems) oraz redukujesz nawracające problemy przez automatyzację. Poprawiasz jakość CI/CD, współpracujesz z zespołami inżynieryjnymi. Wymagane jest aktywne korzystanie z narzędzi AI (LLM, Copilot) w codziennej pracy.
- ✓Nowoczesny stack: Kubernetes, Azure DevOps, Datadog
- ✓Fokus na automatyzację i długoterminowe relacje
- !Wymóg aktywnego korzystania z narzędzi AI może być niejasny – czy to codzienne używanie Copilot, czy coś więcej?
- !Nie określono wielkości zespołu ani liczby dyżurów on-call
- !Brak informacji o procesie rekrutacyjnym
- !Opis 'dynamiczne środowisko' może sugerować chaos
- •Budowanie dashboardów i alertów w Datadog/Grafana do monitorowania wydajności
- •Prowadzenie triage i analizy przyczyn źródłowych (RCA) incydentów produkcyjnych
- •Automatyzacja powtarzalnych zadań i incydentów za pomocą skryptów i CI/CD
- •Praca z klastrami Kubernetes i pipeline'ami Azure DevOps
- •Wdrażanie reliability gates w procesie CI/CD
- •Współpraca z zespołami deweloperskimi przy projektowaniu niezawodnych systemów
- •Używanie narzędzi AI (Copilot, LLM) do automatyzacji i optymalizacji
- •Tworzenie dokumentacji post-mortem i rekomendacji
Oferta dla doświadczonych specjalistów (Senior).
Senior inżynier SRE z minimum 5 latami praktyki w production engineering, potrafiący samodzielnie prowadzić incydenty i budować monitoring, ale niekoniecznie biegły w narzędziach AI (choć wymagane jest aktywne korzystanie z nich).
Juniorzy lub osoby bez doświadczenia w zarządzaniu incydentami, a także inżynierowie unikający pracy z narzędziami AI lub niekomfortowi w dynamicznych środowiskach.
- ?Jak wygląda dyżur on-call – ile osób w rotacji, czy jest dodatkowo płatny?
- ?Ile osób liczy zespół SRE i z iloma zespołami deweloperskimi współpracujecie?
- ?Czy wymóg AI-native oznacza konkretne narzędzia (np. GitHub Copilot, ChatGPT) i jak mierzona jest biegłość?
- ?Jakie są główne KPI niezawodności dla aplikacji AI?
- ?Czy są jakieś specyficzne wymagania compliance w branży finansowej (np. audyty, certyfikaty)?
- ?Jakie są plany rozwoju stacku – czy planujecie migrację do innych narzędzi?
- −Brak informacji o wielkości zespołu
- −Nie opisano procesu rekrutacyjnego
- −Brak szczegółów dotyczących konkretnych narzędzi AI (tylko ogólnie 'AI tools')
Międzynarodowy, dynamiczny zespół z naciskiem na niezawodność i automatyzację. Kultura AI-native, proaktywność i poczucie własności.
Poniżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię SRE. Pełne statystyki zarobków →