Senior Data Engineer – Data Platforms for AI Initiatives
Holisticon Insight
Rola skupia się na budowie nowoczesnej platformy danych dla łańcucha dostaw i ekosystemu wspierającego inicjatywy AI. Praca obejmuje pełny cykl życia danych: od pozyskiwania z systemów ERP i IoT, przez transformację i modelowanie, po zarządzanie danymi nieustrukturyzowanymi (PDFy) pod kątem systemów RAG oraz optymalizację baz wektorowych. To rola typowo inżynierska, z naciskiem na architekturę Data Lakehouse, governance i bezpieczeństwo. Nie jest to rola badawcza ani product development – to budowa infrastruktury danych dla AI.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: nie określono procesu rekrutacyjnego, nie podano wielkości zespołu.
Rola skupia się na budowie nowoczesnej platformy danych dla łańcucha dostaw i ekosystemu wspierającego inicjatywy AI. Praca obejmuje pełny cykl życia danych: od pozyskiwania z systemów ERP i IoT, przez transformację i modelowanie, po zarządzanie danymi nieustrukturyzowanymi (PDFy) pod kątem systemów RAG oraz optymalizację baz wektorowych. To rola typowo inżynierska, z naciskiem na architekturę Data Lakehouse, governance i bezpieczeństwo. Nie jest to rola badawcza ani product development – to budowa infrastruktury danych dla AI.
- ✓Firma oferuje budżet szkoleniowy (np. certyfikaty Microsoft Azure)
- ✓Pełna autonomia techniczna i odpowiedzialność na poziomie inżyniera (płaska struktura, małe zespoły)
- ✓Praca w modelu fully remote
- ✓Firma jest częścią grupy Nexer – stabilność finansowa
- !W ogłoszeniu nie określono budżetu szkoleniowego ani konkretnych certyfikatów – jedynie ogólny 'training budget'
- !Brak informacji o wielkości zespołu, w którym kandydat będzie pracował
- !Brak wzmianki o procesie rekrutacyjnym (ile etapów, zadanie domowe itp.)
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie i implementacja pipeline'ów pozyskiwania danych z systemów ERP
- •Integracja zewnętrznych źródeł danych i danych rynkowych
- •Budowa ujednoliconych modeli danych i taksonomii
- •Tworzenie pipeline'ów dla danych nieustrukturyzowanych (PDF, metadane) na potrzeby systemów RAG
- •Zarządzanie i optymalizacja baz wektorowych
- •Implementacja governance danych, lineage i kontroli dostępu (RBAC)
- •Walidacja jakości danych i optymalizacja pipeline'ów w środowiskach secure
- •Praca z Apache Airflow, Kafka, Spark do orkiestracji i przetwarzania strumieniowego
Oferta dla doświadczonych specjalistów (Senior).
Co najmniej 6 lat doświadczenia w Data Engineering z realnymi projektami związanymi z Lakehouse, streamingiem i ML pipeline'ami. Znajomość podstaw security i governance danych.
Nie dla osób poniżej 6 lat doświadczenia w Data Engineering. Nie dla osób, które nie znają dobrze Sparka i Kafka lub nie miały styczności z danymi nieustrukturyzowanymi.
- ?Ile osób liczy zespół Data Engineering, do którego dołączę?
- ?Czy istnieje już jakaś infrastruktura Data Lakehouse, czy budujemy od zera?
- ?Jaki jest stosunek pracy nad nowymi funkcjonalnościami do utrzymania istniejących systemów?
- ?Czy w projekcie używamy konkretnych baz wektorowych (np. Pinecone, Weaviate, Qdrant)?
- ?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe?
- ?Czy są przewidziane dyżury on-call lub praca w weekendy?
- ?Jaki jest budżet szkoleniowy – czy mogę wybrać dowolne szkolenia/certyfikaty?
- −Nie określono procesu rekrutacyjnego
- −Nie podano wielkości zespołu
- −Brak informacji o oczekiwanym zakresie dyżurów (on-call)
- −Nie sprecyzowano, jakie konkretnie bazy danych (np. Postgres, Snowflake, Databricks) są używane
Płaska struktura, małe zespoły, duża autonomia inżynierska i odpowiedzialność. Firma stawia na nowoczesne technologie i wartość inżynierską.