Data Engineer/ Databricks Developer
7N
Rola skupia się na budowie systemu monitorowania jakości danych (DQX) w oparciu o Databricks dla klienta z branży farmaceutycznej. Na co dzień będziesz projektować i implementować reguły jakości danych, tworzyć pipeline'y ETL/ELT oraz dostarczać dashboardy dla użytkowników biznesowych. To nie jest typowa rola Data Engineera – nacisk kładziony jest na governance i jakość danych, a nie tylko na przetwarzanie.
Brakuje: nie podano wielkości zespołu, brak informacji o tym, czy projekt jest greenfield czy brownfield.
Rola skupia się na budowie systemu monitorowania jakości danych (DQX) w oparciu o Databricks dla klienta z branży farmaceutycznej. Na co dzień będziesz projektować i implementować reguły jakości danych, tworzyć pipeline'y ETL/ELT oraz dostarczać dashboardy dla użytkowników biznesowych. To nie jest typowa rola Data Engineera – nacisk kładziony jest na governance i jakość danych, a nie tylko na przetwarzanie.
- ✓100% zdalnie z transparentną stawką B2B (25 200 – 30 240 PLN netto+VAT)
- ✓Project związany z jakością danych w regulowanej branży – ciekawy temat
- ✓Program rozwoju konsultanta (7N Learning & Development, Consultant Development Program)
- ✓Dedykowany opiekun projektu (dedicated agent) – dodatkowe wsparcie
- !Brak informacji o wielkości zespołu i liczbie zaangażowanych osób
- !Nieznany konkretny klient (tylko 'pharmaceutical industry') – może brakować kontekstu
- !Wiele nice-to-have'ów – może sugerować, że rzeczywiste wymagania są wyższe
- !Rola przez agencję (7N) – możliwa mniejsza stabilność i zmiany projektu
- •Projektowanie i implementacja rozwiązań monitorowania jakości danych w Databricks (DQX)
- •Tworzenie reguł jakości danych i pipeline'ów ETL/ELT
- •Dostarczanie dashboardów i raportów dla użytkowników biznesowych
- •Pisanie kodu w Python i Spark (Scala/SQL) do przetwarzania danych
- •Współpraca z zespołem nad definiowaniem kluczowych elementów danych i zasad zarządzania danymi
- •Zapewnienie spójności między jakością danych, ich wykorzystaniem i kluczowymi elementami danych
- •Utrzymanie i optymalizacja pipeline'ów w środowisku Databricks (Delta Lake)
Oferta dla doświadczonych specjalistów (Senior).
Data Engineer z solidnym doświadczeniem w Databricks i pipeline'ach ETL, który ma podstawowe pojęcie o jakości danych i jest gotów nauczyć się frameworku DQX. Wymagana jest biegła znajomość języka angielskiego.
Juniorzy lub midzi bez zaawansowanej znajomości Databricks i doświadczenia w pipeline'ach. Osoby szukające roli głównie analitycznej lub architektonicznej bez codziennego kodowania.
- ?Ile osób liczy zespół projektowy?
- ?Czy rozwiązanie DQX jest budowane od zera (greenfield) czy rozwijane?
- ?Jakie narzędzia są używane do dashboardów?
- ?Jak wygląda współpraca z biznesem – częstotliwość spotkań?
- ?Czy przewidziane są dyżury on-call?
- ?Jaki jest przewidywany czas trwania projektu?
- ?Czy istnieje możliwość przedłużenia kontraktu po zakończeniu projektu?
- −Nie podano wielkości zespołu
- −Brak informacji o tym, czy projekt jest greenfield czy brownfield
- −Nie sprecyzowano narzędzi do dashboardów
- −Brak informacji o dyżurach/on-call
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię Databricks. Pełne statystyki zarobków →