Pomiń do treści
Logo firmy Link Group

Principal Site Reliability Engineer (AI Platform Architecture)

Link Group

Oferta w skrócie
29 00036 000PLN / mies.
🏠ZdalnieTryb pracy
📄B2BKontrakt
⏱️Senior · 3+ latDoświadczenie
LokalizacjaWarszawa
Źródło
Aktywna
Opublikowano17 kwietnia 2026
Ostatnio sprawdzono6 maja 2026
Wygasa za26 dni
Werdykt JobHunt

To rola Principal SRE odpowiedzialnego za niezawodność i architekturę platform AI. Obowiązki obejmują definiowanie SLO, projektowanie strategii obserwowalności (w tym GPU-monitoring), automatyzację, wdrażanie bezpiecznych deploymentów (canary, rollback) oraz mentoring zespołu. To połączenie architektury systemów, hands-on developmentu i wpływania na decyzje techniczne w całej organizacji. Wymaga głębokiej wiedzy o Kubernetes i Python/Go, a także znajomości AI/ML infra.

Brakuje: brak opisu procesu rekrutacyjnego, nie podano wielkości zespołu sre.

🛠 Wymagane technologie
Dane źródłowe
AI Insights
Czym naprawdę jest ta rola?SRE

To rola Principal SRE odpowiedzialnego za niezawodność i architekturę platform AI. Obowiązki obejmują definiowanie SLO, projektowanie strategii obserwowalności (w tym GPU-monitoring), automatyzację, wdrażanie bezpiecznych deploymentów (canary, rollback) oraz mentoring zespołu. To połączenie architektury systemów, hands-on developmentu i wpływania na decyzje techniczne w całej organizacji. Wymaga głębokiej wiedzy o Kubernetes i Python/Go, a także znajomości AI/ML infra.

Plusy
  • Nowoczesny stack: Kubernetes, Python/Go, AI/ML
  • Rola principalowa z dużym wpływem i autonomią
  • Możliwość mentoringu i kształtowania zespołu
Na co uważać
  • !Brak informacji o wielkości zespołu SRE
  • !Nie sprecyzowano, czy są dyżury on-call
  • !Ogłoszenie nie podaje konkretnych AI workloadów (np. training, inference)
  • !Nie określono procesu rekrutacyjnego
Codzienna praca
  • Definiowanie architektury niezawodności dla usług AI compute, w tym SLO i wzorce fault tolerance
  • Tworzenie narzędzi automatyzacji i platform zwiększających skalę zespołu SRE
  • Projektowanie strategii obserwowalności z monitorowaniem GPU i telemetrią specyficzną dla AI
  • Architektura standardów bezpiecznego wdrożenia: progressive rollouts, canary analysis, automatyczne rollbacki
  • Wpływanie na cykl życia developmentu poprzez review architektury i designu produktów
  • Mentoring zespołu SRE poprzez code review, design review i rozwiązywanie problemów
  • Współpraca z zespołami product engineering w celu wbudowania niezawodności w proces tworzenia oprogramowania
Więcej o ofercie
Dla kogo jest ta oferta
Profil idealny

Oferta dla doświadczonych specjalistów (Senior).

Minimum sensowne

Senior SRE/platform engineer z bardzo dobrym Kubernetes i Python/Go, który ma doświadczenie w skalowalnych systemach i jest gotów rozwijać się w kierunku AI/ML. Mile widziane wcześniejsze doświadczenie z GPU workloadami.

Raczej nie dla

Juniorzy, osoby szukające wyłącznie pracy rąk bez odpowiedzialności architektonicznej, ani osoby niezainteresowane AI/ML infrastructure.

Ocena dopasowania
Junior1/5
Mid2/5
Senior5/5
Hands-on4/5
Architekt5/5
Remote5/5
Enterprise4/5
Pytania do rekrutera
  • ?Jak duży jest zespół SRE i iloma platformami się opiekuje?
  • ?Czy są dyżury on-call? Jeśli tak, jak często i czy są dodatkowo płatne?
  • ?Jakie konkretnie AI/ML workloady są obsługiwane (training, inference, obie)?
  • ?Jaka jest proporcja pracy architektonicznej do hands-on developmentu?
  • ?Czy istnieje budżet na konferencje lub szkolenia?
  • ?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe?
Brakujące informacje
  • Brak opisu procesu rekrutacyjnego
  • Nie podano wielkości zespołu SRE
  • Nie wiadomo, czy są dyżury on-call
  • Nie określono konkretnych narzędzi obserwowalności
  • Nie sprecyzowano poziomu doświadczenia w latach
Wynagrodzenie vs rynekn=40 · Senior · B2B

Powyżej mediany rynkowej

Ta oferta29 00036 000
Mediana: Senior · Go · B2B25 00030 120

Dane z aktywnych ofert zawierających technologię Go.

Powiązane strony
🔗Podobne oferty