Site Reliability Engineer / Platform Engineer
Awareson
To rola Platform Engineering / SRE, skupiona na projektowaniu i automatyzacji infrastruktury chmurowej w Azure, głównie opartej na AKS. Będziesz odpowiedzialny za skalowanie obciążeń (API, bazy danych, komponenty przetwarzania), zarządzanie obserwowalnością (Prometheus/Thanos na dużą skalę) oraz implementację infrastruktury jako kodu (Terraform, CI/CD). Rola wymaga głębokiej znajomości sieci w chmurze i automatyzacji w Pythonie, a celem jest zapewnienie niezawodności i skalowalności platformy dla dziesiątek komponentów systemowych.
Brakuje: nie podano informacji o systemie dyżurów (on-call) – często kluczowe dla sre, brak opisu wielkości zespołu i struktury organizacyjnej.
To rola Platform Engineering / SRE, skupiona na projektowaniu i automatyzacji infrastruktury chmurowej w Azure, głównie opartej na AKS. Będziesz odpowiedzialny za skalowanie obciążeń (API, bazy danych, komponenty przetwarzania), zarządzanie obserwowalnością (Prometheus/Thanos na dużą skalę) oraz implementację infrastruktury jako kodu (Terraform, CI/CD). Rola wymaga głębokiej znajomości sieci w chmurze i automatyzacji w Pythonie, a celem jest zapewnienie niezawodności i skalowalności platformy dla dziesiątek komponentów systemowych.
- ✓Długoterminowy kontrakt (long term)
- ✓Nowoczesny stack: Azure, AKS, Terraform, Prometheus, Grafana, Python
- ✓Rola z autonomią techniczną i realnym wpływem na architekturę
- !Brak informacji o systemie dyżurów on-call – w roli SRE jest to prawdopodobne
- !Nie podano wielkości zespołu ani kontekstu projektu (klient/własny produkt)
- !Opis odpowiedzialności bardzo szeroki – może oznaczać dużą odpowiedzialność przy małym zespole
- •Projektowanie i wdrażanie infrastruktury na Azure AKS (klastry, skalowanie, sieci)
- •Zarządzanie setkami instancji Prometheus/Thanos – konfiguracja, skalowanie, optymalizacja
- •Pisanie i utrzymanie modułów Terraform do zarządzania zasobami chmurowymi
- •Budowa i rozwijanie pipeline'ów CI/CD w GitHub Actions lub Azure DevOps
- •Automatyzacja operacji za pomocą skryptów Python (np. monitoring, skalowanie, recovery)
- •Architektura sieciowa – projektowanie bezpiecznej komunikacji między komponentami (VNet, peering, security rules)
- •Analiza i rozwiązywanie problemów wydajnościowych i niezawodnościowych platformy
- •Dokumentowanie architektury i procedur operacyjnych
Oferta dla doświadczonych specjalistów (Senior).
Inżynier z co najmniej 5 latami w roli Platform/SRE, mający praktykę z Azure i AKS na produkcji, znający Terraform i CI/CD, oraz potrafiący pisać skrypty w Pythonie.
Juniorzy i midzy bez doświadczenia w produkcji cloud, osoby szukające roli czysto programistycznej (backend/fullstack), lub kandydaci niechętni do pracy z infrastrukturą i operacyjnymi aspektami.
- ?Jak wygląda rotacja dyżurów on-call? Czy jest dodatkowo płatna?
- ?Ile osób liczy zespół i jakie są role w zespole?
- ?Jaka jest skala systemu – ile klastrów AKS, serwisów, użytkowników?
- ?Czy to projekt wewnętrzny czy dla klienta? Jaka branża/domena?
- ?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe?
- ?Czy istnieje budżet na szkolenia lub konferencje?
- ?Jakie wyzwania techniczne są obecnie największe – skalowanie, migracja, stabilność?
- −Nie podano informacji o systemie dyżurów (on-call) – często kluczowe dla SRE
- −Brak opisu wielkości zespołu i struktury organizacyjnej
- −Nie wiadomo, czy to projekt wewnętrzny firmy, czy dla klienta zewnętrznego
- −Brak szczegółów procesu rekrutacyjnego
Powyżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Azure. Pełne statystyki zarobków →