👉 Data Engineer (Databricks)
Xebia
Rola skupia się na projektowaniu, budowie i utrzymaniu end-to-end pipeline'ów danych dla raportów pomiarowych klientów oraz licencjonowanych zbiorów danych. Codzienna praca obejmuje zarządzanie Apache Airflow DAG-ami, rozwiązywanie incydentów produkcyjnych, automatyzację procesów operacyjnych oraz zapewnianie jakości danych przed dostawą do klienta. To hybrydowa rola w zespole współpracującym z produktem, inżynierami i nauką pomiarową.
Brakuje: brak informacji o wielkości zespołu i strukturze, nie podano konkretnych usług chmurowych (np. s3, redshift, bigquery).
Rola skupia się na projektowaniu, budowie i utrzymaniu end-to-end pipeline'ów danych dla raportów pomiarowych klientów oraz licencjonowanych zbiorów danych. Codzienna praca obejmuje zarządzanie Apache Airflow DAG-ami, rozwiązywanie incydentów produkcyjnych, automatyzację procesów operacyjnych oraz zapewnianie jakości danych przed dostawą do klienta. To hybrydowa rola w zespole współpracującym z produktem, inżynierami i nauką pomiarową.
- ✓Budżet rozwojowy do 6800 PLN, dofinansowanie certyfikatów AWS/Azure
- ✓Dostęp do Udemy, O'Reilly oraz konferencji technologicznych
- ✓Gildie technologiczne i wewnętrzne szkolenia
- ✓Wsparcie zdrowia psychicznego
- ✓Umowa na czas nieokreślony (B2B lub UoP)
- !Częste wsparcie produkcyjne i deadline'y dostaw mogą oznaczać presję czasową lub dyżury
- !Brak informacji o kompensacji za dyżury produkcyjne
- !Wymaganie 'agentic or AI-driven automation' jako nice-to-have jest dość nieprecyzyjne
- •Projektowanie i budowa end-to-end pipeline'ów danych dla raportów klienckich
- •Operowanie i rozwiązywanie problemów z DAG-ami Apache Airflow (scheduled i on-demand)
- •Zarządzanie dostawami push-based (cloud storage, transfery plików, weryfikacja)
- •Badanie i rozwiązywanie incydentów produkcyjnych w rozproszonych systemach
- •Implementacja automatyzacji i agentów AI do usprawniania procesów operacyjnych
- •Obsługa niestandardowych zapytań o dostawy danych (matching plików, cross-reference)
- •Tworzenie narzędzi do walidacji jakości danych przed dostawą
- •Pisanie i utrzymanie migracji baz danych dla konfiguracji dostaw i klientów
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Osoba z około 2 latami doświadczenia w inżynierii danych lub pokrewnej, która ma praktykę z Databricks i Airflow na podstawowym poziomie, zna Pythona i SQL, i jest gotowa uczyć się w środowisku produkcyjnym.
Nie dla juniorów poniżej 2 lat doświadczenia ani dla osób nieakceptujących pracy hybrydowej (raz w tygodniu w biurze).
- ?Ile osób liczy zespół Data Engineering?
- ?Jak często zdarzają się incydenty produkcyjne i czy jest rotacyjny dyżur on-call?
- ?Jakie konkretnie usługi AWS/GCP są używane na co dzień?
- ?Jaka jest skala przetwarzanych danych (objętość, liczba klientów)?
- ?Czy rola wymaga kontaktu z klientem, czy tylko wewnątrz zespołu?
- ?Jak wygląda proces wdrożenia i onboardingu?
- −Brak informacji o wielkości zespołu i strukturze
- −Nie podano konkretnych usług chmurowych (np. S3, Redshift, BigQuery)
- −Brak opisu systemu on-call i kompensacji
- −Nie wiadomo, jaka jest skala danych i liczba klientów
- −Nie określono, czy rola wymaga bezpośredniej komunikacji z klientem
Zespół współpracuje z produktem, inżynierią, nauką pomiarową i zespołami klienckimi, co sugeruje cross-funkcjonalne środowisko.
CV review – HR Interview – Technical Interview – Client Interview – Decision
Poniżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Databricks. Pełne statystyki zarobków →