AI Plattform Engineer (m/w/d)
emagine
Rola polega na budowie i utrzymaniu skalowalnej, on-premise platformy dla generatywnej AI (LLM) dla dużego publicznego dostawcy IT w Niemczech. Codzienna praca obejmuje konfigurację konteneryzowanych aplikacji (OpenShift), integrację RAG (Retrieval-Augmented Generation), rozwój pipeline'ów danych z wykorzystaniem wektorowych i NoSQL baz danych, tworzenie API dla chatbotów i narzędzi, oraz monitoring i dokumentację. To rola inżynierska z naciskiem na MLOps i infrastrukturę AI, wymagająca głębokiej znajomości Pythona i frameworków AI jak vLLM.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: brak widełek finansowych, nie podano wielkości zespołu.
Rola polega na budowie i utrzymaniu skalowalnej, on-premise platformy dla generatywnej AI (LLM) dla dużego publicznego dostawcy IT w Niemczech. Codzienna praca obejmuje konfigurację konteneryzowanych aplikacji (OpenShift), integrację RAG (Retrieval-Augmented Generation), rozwój pipeline'ów danych z wykorzystaniem wektorowych i NoSQL baz danych, tworzenie API dla chatbotów i narzędzi, oraz monitoring i dokumentację. To rola inżynierska z naciskiem na MLOps i infrastrukturę AI, wymagająca głębokiej znajomości Pythona i frameworków AI jak vLLM.
- ✓Długoterminowy projekt z ramową umową do 2030 roku
- ✓Nowoczesny stack: LLM, RAG, vLLM, konteneryzacja, bazy wektorowe
- ✓Praca w sektorze publicznym – stabilność i przewidywalność
- −Brak widełek wynagrodzenia/stawki – typowe dla agencji, ale utrudnia ocenę oferty
- −Wymagane 8+ lat doświadczenia w AI – bardzo wysokie, co może wskazywać na poszukiwanie eksperta, ale oznaczone jako 'regular' poziom (niespójność)
- !Brak informacji o wielkości zespołu i liczbie równoległych projektów
- !Wymagana bardzo dobra znajomość niemieckiego – może być barierą dla osób nieznających języka
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Konfiguracja i zarządzanie konteneryzowaną platformą LLM na OpenShift
- •Budowa i utrzymanie pipeline'ów ekstrakcji, transformacji i ładowania danych (ETL) do baz wektorowych i NoSQL
- •Integracja i utrzymanie aplikacji RAG (Retrieval-Augmented Generation) z uwierzytelnianiem użytkowników
- •Tworzenie i dokumentowanie API do łączenia chatbotów, rozszerzeń przeglądarkowych, IDE i Office z bazami danych
- •Monitorowanie zasobów, logów i analiza błędów platformy
- •Modelowanie danych i indeksowanie dla wyszukiwania semantycznego
- •Dokumentacja techniczna i ścisła współpraca z zespołem projektowym
- •Utrzymanie stabilności platformy i reagowanie na incydenty
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Inżynier z 5+ latami Python i 8+ latami w AI, który brał udział w co najmniej jednym projekcie platformy AI, zna RAG, potrafi pracować z kontenerami i bazami wektorowymi, i ma bardzo dobry niemiecki.
Osoby bez udokumentowanego doświadczenia w AI (8+ lat), bez praktyki w on-premise AI, ani bez znajomości języka niemieckiego. Juniorzy i midowie bez odpowiedniego stażu nie powinni aplikować.
- ?Jaka jest przewidywana stawka godzinowa dla tej roli?
- ?Ile osób liczy zespół projektowy i jakie są role?
- ?Czy wymagana jest obecność w Berlinie np. na spotkaniach inicjujących?
- ?Jakie konkretne modele LLM są używane na platformie?
- ?Czy przewidziane są dyżury on-call? Jakie SLA?
- ?Jak wygląda proces onboardingu?
- −Brak widełek finansowych
- −Nie podano wielkości zespołu
- −Brak informacji o procesie rekrutacji
- −Nie sprecyzowano oczekiwanego stacku technologicznego szczegółowo (np. które bazy wektorowe)
Praca w projekcie dla dużego publicznego dostawcy IT – wymaga dobrej komunikacji i dokumentacji, prawdopodobnie formalne środowisko.