Senior Site Reliability Engineer
XTB
Rola koncentruje się na budowie i utrzymaniu platformy obserwowalności dla systemów tradingowych XTB obsługujących miliony klientów. SRE będzie projektować telemetrię, wdrażać automatyczne wykrywanie anomalii (AI/ML), uczestniczyć w dyżurach on-call oraz automatyzować operacje. To nie jest rola developerska backendowa – główny nacisk na niezawodność, automatyzację i współpracę z zespołami produktowymi.
Brakuje: nie podano wielkości zespołu sre, brak szczegółów o procesie rekrutacyjnym (liczba etapów, forma).
Rola koncentruje się na budowie i utrzymaniu platformy obserwowalności dla systemów tradingowych XTB obsługujących miliony klientów. SRE będzie projektować telemetrię, wdrażać automatyczne wykrywanie anomalii (AI/ML), uczestniczyć w dyżurach on-call oraz automatyzować operacje. To nie jest rola developerska backendowa – główny nacisk na niezawodność, automatyzację i współpracę z zespołami produktowymi.
- ✓Całkowicie zdalna praca (remote-first)
- ✓Atrakcyjne wynagrodzenie (23-29,2k PLN)
- ✓Firma stabilna (1000+ pracowników, lider FinTech w CEE)
- ✓Certyfikat Great Place to Work
- ✓Dodatkowy dzień wolny z okazji urodzin i dla rodziców
- ✓Budżet szkoleniowy i platforma e-learningowa
- !Wymaganie znajomości AI/ML może być nieprecyzyjne – dopytaj, jak konkretnie będą używane
- !Nie podano szczegółów dotyczących dyżurów on-call (częstotliwość, wynagrodzenie, wielkość zespołu)
- !Brak informacji o procesie rekrutacyjnym
- !Duży nacisk na open-source self-hosted – może wymagać większej odpowiedzialności za infrastrukturę
- •Budowa i rozwój ekosystemu obserwowalności (metryki, tracing, logi) z użyciem self-hosted narzędzi open-source (Prometheus, Grafana, ELK, Tempo, Thanos, Jaeger)
- •Wdrażanie inteligentnego próbkowania i dystrybuowanego tracingu dla głębokiego wglądu w systemy
- •Automatyzacja przepływów SRE i rutynowych zadań operacyjnych przy użyciu Pythona i Ansible
- •Uczestnictwo w rotacyjnym dyżurze on-call oraz zarządzanie incydentami (incident management, post-mortem)
- •Rozwijanie wczesnych systemów ostrzegawczych i automatycznego wykrywania anomalii (AIOps, ML)
- •Współpraca z zespołami produktowymi jako partner w zakresie niezawodności – definiowanie error budgetów i alertów
- •Utrzymywanie i zarządzanie klastrami Kubernetes (AKS i on-prem) w środowisku produkcyjnym
- •Przeprowadzanie analiz poincydentowych i wdrażanie usprawnień
Oferta dla doświadczonych specjalistów (Senior).
Osoba z co najmniej 5-letnim doświadczeniem w SRE/Infra/DevOps, praktyczną znajomością Pythona i Kubernetes oraz podstawami obserwowalności. Musi być gotowa do dyżurów on-call i zarządzania incydentami.
Nie dla juniorów – rola wymaga min. 5 lat doświadczenia w SRE/DevOps oraz samodzielności w projektowaniu systemów. Osoby bez doświadczenia z Kubernetes w produkcji lub niechętne dyżurom on-call również nie powinny aplikować.
- ?Jak często odbywają się dyżury on-call (np. tydzień na miesiąc)? Czy dyżury są dodatkowo płatne?
- ?Ile osób liczy zespół SRE? Jaka jest struktura zespołów produktowych, z którymi będę współpracować?
- ?Jaki jest obecny stan obserwowalności? Czy mamy już wdrożone jakieś narzędzia, czy zaczynamy od zera?
- ?W jaki sposób AI/ML jest faktycznie wykorzystywane w SRE – czy są już modele w produkcji, czy to dopiero plan?
- ?Jaki jest stosunek czasu poświęconego na kodowanie vs. operacje/zarządzanie incydentami?
- ?Czy istnieje możliwość rozwoju w kierunku architekta lub tech leada?
- ?Jak wygląda proces rekrutacji – ile etapów, jakie zadania?
- −Nie podano wielkości zespołu SRE
- −Brak szczegółów o procesie rekrutacyjnym (liczba etapów, forma)
- −Nie wiadomo, czy dyżury on-call są wynagradzane dodatkowo
- −Brak informacji o planach migracji/rozwoju technologicznego (np. czy planowana jest większa automatyzacja)
Kultura współpracy i wspólnej odpowiedzialności za niezawodność – SRE działa jako partner dla zespołów produktowych, a nie tylko jako wsparcie operacyjne. Firma kładzie nacisk na ciągłe doskonalenie i transparentność po incydentach.
Powyżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →