AI Engineer (RAG & On Prem LLMs)

DCG

Oferta w skrócie

17 000 – 23 000PLN / mies.

🔀HybrydowaTryb pracy

📄Umowa o pracęKontrakt

⏱️Mid · 3+ latDoświadczenie

LokalizacjaWarszawa

Dostępne na 2 portalach

JustJoinIT

↗

Aktywna

Opublikowano3 czerwca 2026

Ostatnio sprawdzono3 czerwca 2026

Wygasa za73 dni

Otwórz ofertę u źródła

Werdykt JobHunt

To rola inżyniera AI specjalizującego się w systemach RAG (Retrieval Augmented Generation) i lokalnym wdrażaniu dużych modeli językowych (LLM) w środowisku on-premise. Będziesz projektować, implementować i optymalizować pipeline'y RAG, integrować bazy wektorowe (np. Neo4j) z modelami generatywnymi (LLAMA, Mistral), konfigurować serwery inferencyjne (vLLM, LiteLLM) oraz współpracować z DevOps przy konteneryzacji i automatyzacji MLOps. Domena biznesowa to telekomunikacja, a firma DCG jest agencją rekrutacyjną – praca będzie u ich klienta.

Brakuje: nie podano klienta końcowego ani szczegółów projektu, brak informacji o liczbie dni hybrydowych.

🛠 Wymagane technologie

Dane źródłowe

AIRAG LLM PythonRed HatDeep LearningMachine Learning PyTorchHugging FaceLangchain

AI Insights

Czym naprawdę jest ta rola?AI Engineer

Plusy

✓Możliwość pracy z nowoczesnym stackiem (vLLM, LiteLLM, RAG) w środowisku on-prem
✓Budżet na szkolenia i rozwój (Training & learning opportunities)
✓Rola w dynamicznie rozwijającej się dziedzinie AI/LLM

Na co uważać

!Praca przez agencję rekrutacyjną (DCG) – klient końcowy nie jest ujawniony
!Brak informacji o liczbie dni hybrydowych w tygodniu
!Brak szczegółów dotyczących zespołu i procesu rekrutacyjnego

Codzienna praca

•Projektowanie i implementacja end-to-end pipeline'ów RAG
•Integracja baz wektorowych (np. Neo4j) z modelami generatywnymi
•Fine-tuning i optymalizacja modeli LLM (LLAMA 3.2, Mistral)
•Wdrażanie i konfiguracja serwerów inferencyjnych (vLLM, LiteLLM)
•Współpraca z DevOps przy konteneryzacji (Docker, Kubernetes) i automatyzacji MLOps
•Optymalizacja wydajności modeli przez kwantyzację, przycinanie i dynamiczne batchowanie
•Monitorowanie wydajności systemów i rozwiązywanie problemów
•Współpraca z interesariuszami biznesowymi w celu tłumaczenia wymagań na rozwiązania AI

Więcej o ofercie

Dla kogo jest ta oferta

Profil idealny

Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).

Minimum sensowne

Inżynier ML/NLP z minimum 3-letnim stażem, w tym 2 lata pracy z RAG, podstawową znajomością vLLM i Litellm, oraz doświadczeniem w Pythonie i frameworkach Hugging Face.

Raczej nie dla

Osoby bez doświadczenia w RAG lub z mniej niż 3 latami w ML/NLP. Rola nie jest odpowiednia dla juniorów ani dla badaczy AI bez praktyki inżynierskiej.

Ocena dopasowania

Junior1/5

Mid5/5

Senior3/5

Hands-on5/5

Architekt2/5

Remote2/5

Enterprise3/5

Pytania do rekrutera

?Kim jest klient końcowy i w jakiej branży działa?
?Ile dni w tygodniu wymagana jest obecność w biurze w Warszawie?
?Jaka jest wielkość zespołu AI i DevOps, z którym będę współpracować?
?Czy przewidziane są dyżury on-call? Jakie są oczekiwania dotyczące dostępności?
?Jaki jest przewidywany czas trwania projektu?
?Czy istnieje możliwość zatrudnienia na B2B mimo oferty UoP?
?Jak wygląda proces rekrutacji – ile etapów, czy jest zadanie domowe?

Brakujące informacje

−Nie podano klienta końcowego ani szczegółów projektu
−Brak informacji o liczbie dni hybrydowych
−Nie opisano procesu rekrutacyjnego

Wynagrodzenie vs rynekn=22 · Mid · UoP

Powyżej mediany rynkowej

Ta oferta17 000–23 000 zł

Mediana: Mid · AI · UoP12 500–17 800 zł

Dane z aktywnych ofert zawierających technologię AI.

Powiązane strony

Praca AI Warszawa →

🔗Podobne oferty