Data Engineer (Microsoft Fabric)
Capgemini
Rola polega na utrzymywaniu i rozwijaniu platformy Microsoft Fabric w modelu medallion (bronze, silver, gold). Data Engineer będzie projektować, budować i optymalizować pipeline'y danych (ETL/ELT) z użyciem PySpark i Data Factory. Praca jest wykonywana w ramach zespołu Capgemini, na projektach klienckich, z naciskiem na skalowalność, wydajność i koszty. To typowa rola outsourcingowa z dużą odpowiedzialnością za architekturę danych.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: nie podano liczby dni w biurze (hybryda bez konkretów), brak opisu procesu rekrutacyjnego.
Rola polega na utrzymywaniu i rozwijaniu platformy Microsoft Fabric w modelu medallion (bronze, silver, gold). Data Engineer będzie projektować, budować i optymalizować pipeline'y danych (ETL/ELT) z użyciem PySpark i Data Factory. Praca jest wykonywana w ramach zespołu Capgemini, na projektach klienckich, z naciskiem na skalowalność, wydajność i koszty. To typowa rola outsourcingowa z dużą odpowiedzialnością za architekturę danych.
- ✓Duża liczba szkoleń i certyfikacji (70+ ścieżek) na platformie NEXT
- ✓Przejrzysty system zarządzania wynikami z narzędziem GetSuccess
- ✓Dostęp do bibliotek szkoleniowych (Udemy, TED Talks, platforma językowa)
- ✓Wsparcie psychologiczne i podcast o wellbeing
- !Poziom 'regular' może być zaniżony przy wymaganiach dotyczących architektury Fabric
- !Nie określono liczby dni pracy zdalnej w hybrydzie
- !Brak informacji o rotacji między projektami i możliwych podróżach służbowych
- !Wymagania dotyczące doświadczenia w optymalizacji i skalowaniu mogą sugerować wyższy seniority niż 'regular'
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Utrzymywanie i rozwijanie platformy Microsoft Fabric
- •Projektowanie i budowa pipeline'ów danych w warstwach bronze, silver, gold
- •Optymalizacja modeli danych w warstwie gold dla raportowania i analityki
- •Implementacja transformacji danych w Python (PySpark) lub Spark SQL
- •Monitorowanie wydajności, kosztów i wykorzystania zasobów platformy
- •Orkiestracja i zarządzanie pipeline'ami w Data Factory
- •Zapewnienie skalowalności przy dodawaniu nowych źródeł danych
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Data Engineer z co najmniej 2-letnim doświadczeniem w Microsoft Fabric i medallion, potrafiący samodzielnie budować pipeline'y w PySpark i Data Factory. Gotowy do pracy na projektach klienckich w środowisku hybrydowym.
Osoby bez doświadczenia w Microsoft Fabric lub medallion, ani low-code/juniorzy bez solidnej znajomości PySpark. Rola nie jest odpowiednia dla kogoś szukającego wyłącznie pracy zdalnej – wymagana jest obecność w biurze (hybryda w Katowicach).
- ?Jaka jest wielkość zespołu Data Engineering i struktura?
- ?Ile dni w tygodniu wymagana jest obecność w biurze w Katowicach?
- ?Czy będę pracować na jednym projekcie, czy istnieje rotacja?
- ?Jak wygląda proces rekrutacyjny (etapy, zadanie domowe)?
- ?Czy są dyżury on-call? Jak często?
- ?Jakie narzędzia do monitorowania i alertowania są używane?
- ?Czy istnieje możliwość pracy na innych technologiach poza Fabric?
- −Nie podano liczby dni w biurze (hybryda bez konkretów)
- −Brak opisu procesu rekrutacyjnego
- −Nie wiadomo, czy rola wiąże się z dyżurami on-call
- −Nie podano budżetu szkoleniowego ani kwot na konferencje