Lakehouse Engineer - Onsite Warsaw or Dublin
DCV Technologies
Rola Lakehouse Engineer to zaawansowany Data Engineer specjalizujący się w budowie i utrzymaniu data lake'ów na AWS z wykorzystaniem architektury lakehouse (Apache Iceberg). Na co dzień będziesz projektować skalowalne rozwiązania danych, tworzyć pipeline'y w Python/PySpark, zarządzać orkiestracją workflow (MWAA), wdrażać infrastrukturę jako kod (Terraform) oraz dbać o jakość i bezpieczeństwo danych. To rola stricte inżynierska, skupiona na danych i chmurze, a nie na rozwoju aplikacji.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: widełki wynagrodzenia, wielkość zespołu i kultura pracy.
Rola Lakehouse Engineer to zaawansowany Data Engineer specjalizujący się w budowie i utrzymaniu data lake'ów na AWS z wykorzystaniem architektury lakehouse (Apache Iceberg). Na co dzień będziesz projektować skalowalne rozwiązania danych, tworzyć pipeline'y w Python/PySpark, zarządzać orkiestracją workflow (MWAA), wdrażać infrastrukturę jako kod (Terraform) oraz dbać o jakość i bezpieczeństwo danych. To rola stricte inżynierska, skupiona na danych i chmurze, a nie na rozwoju aplikacji.
- ✓Nowoczesny stack: Apache Iceberg, MWAA, EKS, Terraform
- ✓Długoterminowy kontrakt B2B
- ✓Praca z najnowszymi technologiami data lakehouse na AWS
- ✓Możliwość pracy w Dublinie (jeśli kandydat rozważa relokację)
- −Firma DCV Technologies to agencja rekrutacyjna, co może oznaczać pośrednictwo, a nie bezpośrednie zatrudnienie u klienta
- −Brak widełek wynagrodzenia w ogłoszeniu
- !Brak informacji o wielkości zespołu i strukturze
- !Nieznany proces rekrutacyjny – jedynie 'Send CV'
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie i implementacja data lake'ów na AWS (S3, EMR, Iceberg)
- •Tworzenie i utrzymanie pipeline'ów danych w PySpark i Python
- •Orkiestracja workflow z użyciem MWAA (Managed Workflows for Apache Airflow)
- •Pisanie i zarządzanie kodem infrastrukturalnym Terraform (IaC)
- •Konfiguracja CI/CD dla pipeline'ów danych i komponentów infra
- •Implementacja zasad data quality, data security i governance
- •Praca z AWS IAM, Lambda, EKS przy budowie środowiska danych
- •Współpraca z zespołami analitycznymi i biznesowymi przy definiowaniu wymagań danych
Oferta dla doświadczonych specjalistów (Senior).
Inżynier Danych z co najmniej 3-4 latami doświadczenia w AWS, solidną znajomością Pythona i PySpark oraz podstawami Terraform. Powinien mieć praktykę z przynajmniej kilkoma wymienionymi serwisami AWS i rozumieć koncepcje data quality.
Juniorzy bez doświadczenia w AWS Data Lake, osoby szukające pracy w pełni zdalnej (model stacjonarny w Warszawie lub Dublinie) oraz kandydaci bez znajomości Terraform i CI/CD.
- ?Ile osób liczy zespół danych i jak jest zorganizowany?
- ?Jak wygląda proces rekrutacji – ile etapów, czy jest zadanie domowe?
- ?Czy istnieje możliwość pracy zdalnej w jakimś zakresie?
- ?Czy stosowane są inne narzędzia do orkiestracji (Airflow) poza MWAA?
- ?Jaki jest zakres odpowiedzialności za data governance – czy są dedykowane osoby?
- ?Czy oferta obejmuje wsparcie w relokacji do Dublina?
- −Widełki wynagrodzenia
- −Wielkość zespołu i kultura pracy
- −Szczegóły procesu rekrutacyjnego
- −Benefity i dodatki (np. budżet szkoleniowy)
- −Informacja o ewentualnym on-call