AI Engineer (RAG & On Prem LLMs)
DCG
To rola inżyniera AI specjalizującego się w systemach RAG (Retrieval Augmented Generation) i lokalnym wdrażaniu dużych modeli językowych (LLM) w środowisku on-premise. Będziesz projektować, implementować i optymalizować pipeline'y RAG, integrować bazy wektorowe (np. Neo4j) z modelami generatywnymi (LLAMA, Mistral), konfigurować serwery inferencyjne (vLLM, LiteLLM) oraz współpracować z DevOps przy konteneryzacji i automatyzacji MLOps. Domena biznesowa to telekomunikacja, a firma DCG jest agencją rekrutacyjną – praca będzie u ich klienta.
Brakuje: nie podano klienta końcowego ani szczegółów projektu, brak informacji o liczbie dni hybrydowych.
To rola inżyniera AI specjalizującego się w systemach RAG (Retrieval Augmented Generation) i lokalnym wdrażaniu dużych modeli językowych (LLM) w środowisku on-premise. Będziesz projektować, implementować i optymalizować pipeline'y RAG, integrować bazy wektorowe (np. Neo4j) z modelami generatywnymi (LLAMA, Mistral), konfigurować serwery inferencyjne (vLLM, LiteLLM) oraz współpracować z DevOps przy konteneryzacji i automatyzacji MLOps. Domena biznesowa to telekomunikacja, a firma DCG jest agencją rekrutacyjną – praca będzie u ich klienta.
- ✓Możliwość pracy z nowoczesnym stackiem (vLLM, LiteLLM, RAG) w środowisku on-prem
- ✓Budżet na szkolenia i rozwój (Training & learning opportunities)
- ✓Rola w dynamicznie rozwijającej się dziedzinie AI/LLM
- !Praca przez agencję rekrutacyjną (DCG) – klient końcowy nie jest ujawniony
- !Brak informacji o liczbie dni hybrydowych w tygodniu
- !Brak szczegółów dotyczących zespołu i procesu rekrutacyjnego
- •Projektowanie i implementacja end-to-end pipeline'ów RAG
- •Integracja baz wektorowych (np. Neo4j) z modelami generatywnymi
- •Fine-tuning i optymalizacja modeli LLM (LLAMA 3.2, Mistral)
- •Wdrażanie i konfiguracja serwerów inferencyjnych (vLLM, LiteLLM)
- •Współpraca z DevOps przy konteneryzacji (Docker, Kubernetes) i automatyzacji MLOps
- •Optymalizacja wydajności modeli przez kwantyzację, przycinanie i dynamiczne batchowanie
- •Monitorowanie wydajności systemów i rozwiązywanie problemów
- •Współpraca z interesariuszami biznesowymi w celu tłumaczenia wymagań na rozwiązania AI
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Inżynier ML/NLP z minimum 3-letnim stażem, w tym 2 lata pracy z RAG, podstawową znajomością vLLM i Litellm, oraz doświadczeniem w Pythonie i frameworkach Hugging Face.
Osoby bez doświadczenia w RAG lub z mniej niż 3 latami w ML/NLP. Rola nie jest odpowiednia dla juniorów ani dla badaczy AI bez praktyki inżynierskiej.
- ?Kim jest klient końcowy i w jakiej branży działa?
- ?Ile dni w tygodniu wymagana jest obecność w biurze w Warszawie?
- ?Jaka jest wielkość zespołu AI i DevOps, z którym będę współpracować?
- ?Czy przewidziane są dyżury on-call? Jakie są oczekiwania dotyczące dostępności?
- ?Jaki jest przewidywany czas trwania projektu?
- ?Czy istnieje możliwość zatrudnienia na B2B mimo oferty UoP?
- ?Jak wygląda proces rekrutacji – ile etapów, czy jest zadanie domowe?
- −Nie podano klienta końcowego ani szczegółów projektu
- −Brak informacji o liczbie dni hybrydowych
- −Nie opisano procesu rekrutacyjnego
Powyżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię AI.