Senior Data Engineer – Data Platforms for AI Initiatives

Holisticon Insight

Oferta w skrócie

Widełki nieujawnione

🏠ZdalnieTryb pracy

📄B2BKontrakt

⏱️Senior · 5+ latDoświadczenie

LokalizacjaWrocław

Źródło

JustJoinIT

↗

Aktywna

Opublikowano28 maja 2026

Ostatnio sprawdzono28 maja 2026

Wygasa za67 dni

Otwórz ofertę u źródła

Werdykt JobHunt

Rola skupia się na budowie nowoczesnej platformy danych dla łańcucha dostaw i ekosystemu wspierającego inicjatywy AI. Praca obejmuje pełny cykl życia danych: od pozyskiwania z systemów ERP i IoT, przez transformację i modelowanie, po zarządzanie danymi nieustrukturyzowanymi (PDFy) pod kątem systemów RAG oraz optymalizację baz wektorowych. To rola typowo inżynierska, z naciskiem na architekturę Data Lakehouse, governance i bezpieczeństwo. Nie jest to rola badawcza ani product development – to budowa infrastruktury danych dla AI.

Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.

Brakuje: nie określono procesu rekrutacyjnego, nie podano wielkości zespołu.

🛠 Wymagane technologie

Dane źródłowe

Airflow CI/CD Docker Kubernetes Kafka SQL PythonApache Spark

AI Insights

Czym naprawdę jest ta rola?Data Engineer

Plusy

✓Firma oferuje budżet szkoleniowy (np. certyfikaty Microsoft Azure)
✓Pełna autonomia techniczna i odpowiedzialność na poziomie inżyniera (płaska struktura, małe zespoły)
✓Praca w modelu fully remote
✓Firma jest częścią grupy Nexer – stabilność finansowa

Na co uważać

!W ogłoszeniu nie określono budżetu szkoleniowego ani konkretnych certyfikatów – jedynie ogólny 'training budget'
!Brak informacji o wielkości zespołu, w którym kandydat będzie pracował
!Brak wzmianki o procesie rekrutacyjnym (ile etapów, zadanie domowe itp.)

?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji

Codzienna praca

•Projektowanie i implementacja pipeline'ów pozyskiwania danych z systemów ERP
•Integracja zewnętrznych źródeł danych i danych rynkowych
•Budowa ujednoliconych modeli danych i taksonomii
•Tworzenie pipeline'ów dla danych nieustrukturyzowanych (PDF, metadane) na potrzeby systemów RAG
•Zarządzanie i optymalizacja baz wektorowych
•Implementacja governance danych, lineage i kontroli dostępu (RBAC)
•Walidacja jakości danych i optymalizacja pipeline'ów w środowiskach secure
•Praca z Apache Airflow, Kafka, Spark do orkiestracji i przetwarzania strumieniowego

Więcej o ofercie

Dla kogo jest ta oferta

Profil idealny

Oferta dla doświadczonych specjalistów (Senior).

Minimum sensowne

Co najmniej 6 lat doświadczenia w Data Engineering z realnymi projektami związanymi z Lakehouse, streamingiem i ML pipeline'ami. Znajomość podstaw security i governance danych.

Raczej nie dla

Nie dla osób poniżej 6 lat doświadczenia w Data Engineering. Nie dla osób, które nie znają dobrze Sparka i Kafka lub nie miały styczności z danymi nieustrukturyzowanymi.

Ocena dopasowania

Junior1/5

Mid2/5

Senior5/5

Hands-on5/5

Architekt3/5

Remote5/5

Enterprise3/5

Pytania do rekrutera

?Ile osób liczy zespół Data Engineering, do którego dołączę?
?Czy istnieje już jakaś infrastruktura Data Lakehouse, czy budujemy od zera?
?Jaki jest stosunek pracy nad nowymi funkcjonalnościami do utrzymania istniejących systemów?
?Czy w projekcie używamy konkretnych baz wektorowych (np. Pinecone, Weaviate, Qdrant)?
?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe?
?Czy są przewidziane dyżury on-call lub praca w weekendy?
?Jaki jest budżet szkoleniowy – czy mogę wybrać dowolne szkolenia/certyfikaty?

Brakujące informacje

−Nie określono procesu rekrutacyjnego
−Nie podano wielkości zespołu
−Brak informacji o oczekiwanym zakresie dyżurów (on-call)
−Nie sprecyzowano, jakie konkretnie bazy danych (np. Postgres, Snowflake, Databricks) są używane

Zespół

Płaska struktura, małe zespoły, duża autonomia inżynierska i odpowiedzialność. Firma stawia na nowoczesne technologie i wartość inżynierską.

Powiązane strony

Praca Airflow →Zarobki Airflow →Praca Airflow Wrocław →