Media Data Engineer (Databricks)
Procter & Gamble
Rola Data Engineera w wewnętrznym zespole IT P&G, odpowiedzialnego za budowanie i utrzymanie pipeline'ów danych z kampanii reklamowych na platformach społecznościowych (TikTok, YouTube, Instagram) dla regionu Europy Środkowej. Głównym narzędziem jest Databricks z PySpark i SQL, a dane służą 700 użytkownikom do analityki i optymalizacji wydatków marketingowych. Jest to rola czysto inżynierska (70% kodowania), bez researchu ML.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: wielkość zespołu data engineering, szczegóły dotyczące wsparcia l3 (on-call, wynagrodzenie za dyżury).
Rola Data Engineera w wewnętrznym zespole IT P&G, odpowiedzialnego za budowanie i utrzymanie pipeline'ów danych z kampanii reklamowych na platformach społecznościowych (TikTok, YouTube, Instagram) dla regionu Europy Środkowej. Głównym narzędziem jest Databricks z PySpark i SQL, a dane służą 700 użytkownikom do analityki i optymalizacji wydatków marketingowych. Jest to rola czysto inżynierska (70% kodowania), bez researchu ML.
- ✓Dostęp do akcji P&G (equity) dla pracowników
- ✓Możliwość zmiany roli co kilka lat – rozwój wewnętrzny
- ✓Wpływ na decyzje i innowacje w obszarze danych marketingowych
- ✓Wsparcie AI w codziennej pracy (GitHub Copilot, wewnętrzne narzędzia)
- ✓Praca nad realnym produktem analitycznym dla 700 użytkowników
- !W obowiązkach jest wsparcie L3 – może wiązać się z dyżurami lub pracą po godzinach
- !Brak widełek wynagrodzenia w ogłoszeniu (tylko 'competitive')
- !Model hybrydowy: 2 dni zdalnie, 3 w biurze – wymóg częstej obecności
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie i implementacja pipeline'ów ETL/ELT w Databricks przy użyciu PySpark i SQL
- •Przygotowywanie dużych zbiorów danych z API social media (TikTok, YouTube, Instagram)
- •Pisanie i optymalizacja kodu w notebookach Databricks i zarządzanie klastrami
- •Współpraca z architektami i menedżerami danych przy definiowaniu rozwiązań technicznych
- •Zapewnianie wsparcia L3 dla istniejących procesów danych (debugowanie, analiza błędów)
- •Udział w ceremonii Scrum (daily, planning, retrospective) i dostarczanie projektu zgodnie z priorytetami biznesowymi
- •Identyfikacja i realizacja inicjatyw redukujących dług techniczny (refaktoryzacja infrastruktury)
- •Korzystanie z AI (GitHub Copilot, BMAD) do przyspieszania developmentu
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Data engineer z co najmniej 2-3 latami praktyki w PySpark i SQL, który uruchamiał notebooki Databricks i ma podstawową znajomość GCP. Może nie mieć doświadczenia z social media, ale chętnie się uczy.
Juniorzy bez komercyjnego doświadczenia w data engineeringu – wymagana jest samodzielność w PySpark/Databricks. Nie dla osób szukających roli czysto badawczej (ML) lub developerskiej niezwiązanej z danymi.
- ?Ile osób liczy zespół Backend Engineering i jak są podzielone role?
- ?Jak dokładnie wygląda wsparcie L3 – czy są dyżury i jaka jest ich częstotliwość?
- ?Czy istnieje konkretny budżet szkoleniowy na certyfikacje (np. GCP, Databricks)?
- ?Jaki jest harmonogram hybrydowy – czy 2 dni zdalne to sztywna zasada?
- ?Jakie są największe wyzwania techniczne w obecnych pipeline'ach mediowych?
- ?Czy rola obejmuje pracę greenfield, czy głównie utrzymanie legacy?
- ?Jak mierzona jest skuteczność pracy i jakie są cele na pierwsze 6 miesięcy?
- −Wielkość zespołu data engineering
- −Szczegóły dotyczące wsparcia L3 (on-call, wynagrodzenie za dyżury)
- −Konkretny harmonogram obecności w biurze (2 dni zdalne vs. 3 dni w biurze)
- −Budżet na szkolenia i certyfikacje
- −Opis procesu rekrutacyjnego (etapy, zadanie domowe)
Praca w Scrumie z nastawieniem na współpracę, innowacje i ciągłe doskonalenie. Zespół promuje wykorzystanie AI do przyspieszania pracy i dzielenie się wiedzą.