AI Engineer (RAG & On Prem LLMs)

Diverse CG

Oferta w skrócie

17 000 – 23 000PLN / mies.

🏢StacjonarnaTryb pracy

📄Umowa o pracęKontrakt

⏱️Mid · 3+ latDoświadczenie

LokalizacjaWarszawa

Źródło

NoFluffJobs

↗

Aktywna

Opublikowano3 czerwca 2026

Ostatnio sprawdzono3 czerwca 2026

Wygasa za12 dni

Otwórz ofertę u źródła

Werdykt JobHunt

Rola specjalizuje się w budowie i wdrażaniu systemów Retrieval Augmented Generation (RAG) w środowiskach on-premises dla klientów z sektora telekomunikacyjnego. Będziesz projektować potoki RAG, integrować modele generatywne z wektorowymi bazami danych (Neo4j), optymalizować inferencję przy użyciu vLLM/LiteLLM oraz konteneryzować rozwiązania w Docker/Kubernetes. To nie jest rola badawcza – skupiasz się na inżynierii i deploymencie modeli open-source w produkcji.

Brakuje: nie podano wielkości zespołu ai/ml, brak opisu procesu rekrutacyjnego (liczba etapów, zadanie domowe?).

🛠 Wymagane (Must Have)

Dane źródłowe

AIMLRAG NLPLLAMAPythonMistralPyTorchRed HatDeepSeekLangChain OpenShiftHugging FaceDeep learningMachine learning

AI Insights

Czym naprawdę jest ta rola?AI Application Developer

Plusy

✓Budżet szkoleniowy (Training budget)
✓Dzień wolny na urodziny
✓ZFŚŚ (Zakładowy Fundusz Świadczeń Socjalnych)
✓Prywatna opieka medyczna i karta sportowa

Na co uważać

!Praca wyłącznie stacjonarna w Warszawie – brak elastyczności
!Brak informacji o wielkości zespołu i procesie rekrutacyjnym
!Nie określono, czy rola wiąże się z dyżurami on-call
!Sektor telekomunikacyjny może oznaczać pracę z legacy systemami

Codzienna praca

•Projektowanie i implementacja end-to-end pipeline'ów RAG z użyciem LangChain i Hugging Face Transformers
•Integracja wektorowych baz danych (Neo4j) z modelami LLM (LLAMA 3.2, Mistral, DeepSeek)
•Optymalizacja inferencji przez kwantyzację, przycinanie i dynamiczne batchowanie
•Konfiguracja serwerów inferencyjnych vLLM i LiteLLM dla niskiego opóźnienia
•Konteneryzacja workflowów z Docker i Kubernetes oraz automatyzacja MLOps
•Monitorowanie wydajności systemu i rozwiązywanie problemów z wydajnością
•Współpraca z inżynierami danych i interesariuszami biznesowymi w celu dopasowania rozwiązań do wymagań
•Optymalizacja infrastruktury GPU dla trenowania i inferencji modeli

Więcej o ofercie

Dla kogo jest ta oferta

Profil idealny

Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).

Minimum sensowne

Inżynier ML z co najmniej 3-letnim doświadczeniem ogólnym, w tym minimum 1 rok pracy z RAG. Solidne podstawy Pythona i PyTorcha, znajomość LangChain i podstaw konteneryzacji. Gotowość do nauki vLLM i OpenShift w trakcie onboardingu.

Raczej nie dla

Nie dla osób z mniej niż 3 latami doświadczenia w ML/NLP, ani dla badaczy/Data Scientistów bez umiejętności inżynieryjnych (deployment, konteneryzacja). Rola wymaga biegłości technicznej i samodzielności w środowisku on-prem.

Ocena dopasowania

Junior1/5

Mid5/5

Senior3/5

Hands-on5/5

Architekt2/5

Remote1/5

Enterprise3/5

Pytania do rekrutera

?Ile osób liczy zespół AI/ML, z którym będę pracować?
?Czy rola jest związana z jednym konkretnym projektem, czy z różnymi klientami?
?Jak wygląda proces wdrożenia modeli do produkcji – kto odpowiada za MLOps?
?Czy są przewidziane dyżury on-call? Jak często?
?Jaki jest stosunek pracy nad RAG vs. optymalizacją infrastruktury?
?Czy istnieje możliwość pracy zdalnej w niektóre dni po okresie wdrożenia?
?Jakie są największe wyzwania techniczne w obecnych projektach RAG?

Brakujące informacje

−Nie podano wielkości zespołu AI/ML
−Brak opisu procesu rekrutacyjnego (liczba etapów, zadanie domowe?)
−Nie wiadomo, czy rola wymaga dyżurów on-call
−Nie określono, czy praca jest na jednym projekcie czy rotacyjnie

Zespół

Zespół współpracuje ściśle z inżynierami danych i interesariuszami biznesowymi w środowisku telekomunikacyjnym. Kładzie się nacisk na komunikację i przekładanie wymagań biznesowych na rozwiązania techniczne.

Wynagrodzenie vs rynekn=80 · Mid · UoP

Powyżej mediany rynkowej

Ta oferta17 000–23 000 zł

Mediana: Mid · Python · UoP13 065–20 000 zł

Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →

Powiązane strony

Praca Python →Zarobki Python →Praca Python Warszawa →

🔗Podobne oferty