Senior/Staff Software Engineer, GenAI Infrastructure
To rola dla doświadczonego inżyniera backend/platform, który będzie budował warstwę pośredniczącą (middleware) między API a modelami AI w Google Cloud. Nie chodzi o tworzenie modeli, ale o infrastrukturę do ich wydajnego serwowania – skalujące się systemy, optymalizację GPU/TPU, pipeline'y danych i automatyzację MLOps. Praca w dużym zespole na ogromną skalę, z naciskiem na wydajność i niezawodność.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: brak widełek wynagrodzenia, nie określono liczby dni hybrydowych.
To rola dla doświadczonego inżyniera backend/platform, który będzie budował warstwę pośredniczącą (middleware) między API a modelami AI w Google Cloud. Nie chodzi o tworzenie modeli, ale o infrastrukturę do ich wydajnego serwowania – skalujące się systemy, optymalizację GPU/TPU, pipeline'y danych i automatyzację MLOps. Praca w dużym zespole na ogromną skalę, z naciskiem na wydajność i niezawodność.
- ✓Praca nad kluczową infrastrukturą GenAI w Google Cloud
- ✓Duża skala i wpływ – systemy obsługujące miliardy użytkowników
- ✓Kultura empowermentu i bias to action
- ✓Dostęp do najnowszych technologii AI/ML i narzędzi Google
- !Brak określenia liczby dni hybrydowych w biurze
- !Wymaganie 5 lat doświadczenia może być sztywno egzekwowane
- !Duża organizacja – potencjalnie dużo procesów i biurokracji
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie i implementacja backendowych bibliotek, serwisów i systemów wspierających przepływy AI/ML (frameworki agentowe, protokoły, platformy serwowania modeli, feature store, pipeline'y danych, API gateway)
- •Optymalizacja wydajności, opóźnień, przepustowości i wykorzystania zasobów (GPU/TPU, pamięć) komponentów middleware
- •Zapewnianie skalowalności, wysokiej dostępności i odporności na awarie infrastruktury AI/ML
- •Integracja modeli i źródeł danych z infrastrukturą serwującą we współpracy z inżynierami ML i data scientist
- •Automatyzacja deploymentu, testowania i operacji związanych z infrastrukturą AI/ML (praktyki MLOps)
- •Budowanie RESTful lub gRPC API dla konsumentów wewnętrznych i zewnętrznych
- •Praca z frameworkami serwowania modeli (TensorFlow Serving, TorchServe, Triton Inference Server) oraz platformami jak Vertex AI Prediction
- •Utrzymanie i rozwój infrastruktury na GCP (Vertex AI, GKE, Cloud Storage, BigQuery)
Oferta dla doświadczonych specjalistów (Senior).
Inżynier z co najmniej 5 latami w Javie/Kotlin i 3 latami w infrastrukturze rozproszonej, który spełnia minimalne wymagania, ale może nie mieć jeszcze głębokiej wiedzy o serwowaniu modeli AI.
Osoby z mniej niż 5 latami doświadczenia w backendzie i systemach rozproszonych, a także juniorzy i midowie bez silnych podstaw w skalującej się infrastrukturze. Rola nie jest dla ML researcherów ani data scientistów.
- ?Ile dni w tygodniu pracy w biurze w Warszawie?
- ?Jaka jest wielkość zespołu Cloud AI w Polsce i jego struktura?
- ?Czy istnieje dyżur on-call? Jak często?
- ?Jaki jest stosunek pracy nad nowymi systemami do utrzymania istniejących?
- ?Czy przewidziane są wyjazdy lub współpraca z zespołami w innych lokalizacjach?
- ?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe?
- ?Czy istnieje możliwość pracy w pełni zdalnej po okresie wdrożenia?
- −Brak widełek wynagrodzenia
- −Nie określono liczby dni hybrydowych
- −Brak opisu procesu rekrutacyjnego
- −Nie podano informacji o dyżurach on-call
- −Nieznana wielkość zespołu i podział ról
Kultura empowermentu i bias to action, praca w dynamicznym środowisku z dużymi oczekiwaniami i autonomią techniczną.