Data Scientist – RAG & Document Intelligence
Craftware
Budowa platformy RAG do inteligentnego przetwarzania dokumentów dla międzynarodowej firmy z branży zdrowia konsumenckiego. Rola łączy research z inżynierią: projektowanie i optymalizację pipeline'ów RAG (chunking, embedding, hybrid search, re-ranking), benchmarkowanie modeli LLM, budowę zestawów ewaluacyjnych oraz architektur multi-agentowych. Pracujesz na zielonym polu, decydując o kształcie systemu, który umożliwi użytkownikom biznesowym interakcję z wiedzą ukrytą w złożonych dokumentach przy użyciu naturalnego języka.
Brakuje: nie podano wielkości zespołu, brak informacji o procesie rekrutacyjnym.
Budowa platformy RAG do inteligentnego przetwarzania dokumentów dla międzynarodowej firmy z branży zdrowia konsumenckiego. Rola łączy research z inżynierią: projektowanie i optymalizację pipeline'ów RAG (chunking, embedding, hybrid search, re-ranking), benchmarkowanie modeli LLM, budowę zestawów ewaluacyjnych oraz architektur multi-agentowych. Pracujesz na zielonym polu, decydując o kształcie systemu, który umożliwi użytkownikom biznesowym interakcję z wiedzą ukrytą w złożonych dokumentach przy użyciu naturalnego języka.
- ✓Zielone pole – brak legacy, pełna autonomia techniczna
- ✓Dedykowany budżet certyfikacyjny
- ✓Codzienne wsparcie liderów zespołu i zdefiniowana ścieżka rozwoju
- ✓Praca w pełni zdalna
- !Projekt dla klienta zewnętrznego – możliwa zmiana projektu po zakończeniu
- !Nie podano wielkości zespołu ani struktury raportowania
- •Projektowanie i iteracyjna optymalizacja pipeline'ów RAG (strategie chunkingu, modele embeddingów, wyszukiwanie hybrydowe, re-ranking)
- •Benchmarkowanie i ewaluacja modeli LLM, embeddingów i parserów dokumentów pod kątem dokładności, opóźnień i kosztów
- •Budowa zestawów ewaluacyjnych i definiowanie metryk jakości specyficznych dla RAG (RAGAS, DeepEval, Langfuse)
- •Projektowanie architektur multi-agentowych z użyciem LangGraph, LangChain lub Pydantic AI
- •Parsowanie różnorodnych i zaszumionych formatów dokumentów (PDF, Word, skany, tabele, wykresy)
- •Monitorowanie zużycia tokenów, profili opóźnień i jakości wyszukiwania, podejmowanie decyzji o kompromisach między wydajnością a kosztem
- •Kształtowanie systemu we współpracy z użytkownikami biznesowymi z działów handlowych, marketingowych, R&D i logistyki
Oferta dla doświadczonych specjalistów (Senior).
Mid-level inżynier ML z co najmniej 2-3 latami doświadczenia w NLP i podstawami RAG, gotowy do nauki i pracy nad zielonym polem.
Osoby bez praktycznego doświadczenia w RAG i NLP, ani juniorzy z mniej niż 2 latami pracy w ML. Rola wymaga samodzielności w projektowaniu i eksperymentowaniu.
- ?Ile osób liczy zespół projektowy?
- ?Jak długi jest przewidywany czas trwania projektu?
- ?Czy praca odbywa się bezpośrednio dla klienta czy przez Craftware?
- ?Jaka jest częstotliwość spotkań z klientem?
- ?Czy są narzucone konkretne terminy lub harmonogramy?
- ?Jak wygląda proces decyzyjny dotyczący wyboru technologii?
- ?Czy istnieje możliwość przejścia na inne projekty po zakończeniu?
- ?Jakie są oczekiwania co do dyspozycyjności (np. dyżury, nadgodziny)?
- −Nie podano wielkości zespołu
- −Brak informacji o procesie rekrutacyjnym
- −Nie wiadomo, czy projekt jest długoterminowy
- −Brak informacji o ewentualnych dyżurach on-call
Zespół wspierający – codzienne wsparcie liderów, zdefiniowana ścieżka rozwoju, nastawienie na współpracę i autonomię.
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →