Data Engineer (DBX,dbt), Regular

Webellian

Oferta w skrócie

Widełki nieujawnione

🔀HybrydowaTryb pracy

📄Umowa o pracęKontrakt

⏱️Mid · 3+ latDoświadczenie

LokalizacjaWarszawa

Źródło

Pracuj.pl

↗

Aktywna

Opublikowano27 maja 2026

Ostatnio sprawdzono27 maja 2026

Wygasa za3 dni

Otwórz ofertę u źródła

Werdykt JobHunt

To rola Data Engineera w projekcie dla klienta z branży ubezpieczeniowej, polegająca na budowie pipeline'ów danych dla systemu przetwarzania dokumentów z użyciem modeli LLM. Będziesz pracować głównie w Databricks, Pythonie, PySpark i SQL, przygotowując zbiory treningowe dla modeli ML i tworząc end-to-end data pipelines. Praca hybrydowa w Warszawie (1 dzień w biurze tygodniowo), zespół w Polsce i globalni interesariusze.

Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.

Brakuje: wielkość zespołu, konkretne usługi azure (jeśli wykorzystywane).

🛠 Wymagane technologie

Dane źródłowe

Python SQL PySpark

AI Insights

Czym naprawdę jest ta rola?Data Engineer

Plusy

✓Nowy, innowacyjny projekt z LLM
✓Nowoczesny stack technologiczny (Databricks, PySpark)
✓Międzynarodowy zespół i bezpośrednia współpraca z data scientistami
✓Angielskie zajęcia i inne benefity (pinball, PlayStation w biurze)

Na co uważać

!Praca w modelu hybrydowym (1 dzień w biurze tygodniowo) – wymagane dojazdy do Warszawy (Mokotów)
!Rola w firmie consultingowej, co może wiązać się ze zmianą projektu w przyszłości
!Brak informacji o on-call lub dyżurach
!Projekt używa LLM – może wymagać nauki nowych technologii

?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji

Codzienna praca

•Projektowanie i implementacja end-to-end pipeline'ów danych (pozyskiwanie, transformacja, przechowywanie, konsumpcja)
•Przygotowywanie i utrzymywanie wysokiej jakości zbiorów treningowych dla modeli LLM
•Praca z dużymi wolumenami danych na platformie Databricks
•Optymalizacja wydajności, niezawodności i automatyzacji przepływów danych
•Współpraca z data scientistami, inżynierami i interesariuszami biznesowymi
•Stosowanie najlepszych praktyk inżynierii danych, testowania i wdrażania (CI/CD)
•Debugowanie i rozwiązywanie problemów związanych z danymi i pipeline'ami
•Budowanie datasetów do skanowania dokumentów i wspomagania decyzji

Więcej o ofercie

Dla kogo jest ta oferta

Profil idealny

Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).

Minimum sensowne

Data Engineer z co najmniej 2-letnim doświadczeniem w budowie pipeline'ów na Databricks, dobrym Pythonie i SQL, gotowy do pracy w hybrydowym modelu w Warszawie.

Raczej nie dla

Osoby bez doświadczenia z Databricks lub na poziomie Junior, które nie mają jeszcze solidnych podstaw w PySpark i ETL. Rola wymaga samodzielności i znajomości nowoczesnych narzędzi data engineering.

Ocena dopasowania

Junior2/5

Mid4/5

Senior3/5

Hands-on5/5

Architekt2/5

Remote3/5

Enterprise3/5

Pytania do rekrutera

?Ile osób liczy zespół projektowy?
?Jakie konkretnie usługi Azure są używane (Data Lake, Synapse, itp.)?
?Czy przewidziane są dyżury on-call lub praca w weekendy?
?Jakie narzędzia do orkiestracji są używane (Airflow, Azure Data Factory)?
?Czy istnieje możliwość pracy zdalnej w pełni po okresie wdrożenia?
?Jaki jest planowany czas trwania projektu?
?Czy są jakieś przestarzałe systemy, z którymi trzeba się integrować?

Brakujące informacje

−Wielkość zespołu
−Konkretne usługi Azure (jeśli wykorzystywane)
−Narzędzia do orkiestracji i monitoringu
−Informacja o dyżurach on-call
−Budżet szkoleniowy

Zespół

Międzynarodowy zespół, luźna atmosfera, pinball, PlayStation – miejsce stawiające na jakość kodu i ciągły rozwój.

Rekrutacja

3 etapy: rozmowa telefoniczna z rekruterem, techniczna rozmowa online sprawdzająca umiejętności, spotkanie face-to-face z przełożonym, następnie feedback.

Powiązane strony

Praca Python →Zarobki Python →Praca Python Warszawa →

🔗Podobne oferty