Senior Data / Software Engineer (Azure, Databricks) B2B
Reply Polska
Rola łączy inżynierię danych z software engineeringiem. Będziesz projektować i budować skalowalne pipeliny danych na platformie Azure, migrować legacy SQL (głównie procedury składowane) do nowoczesnych architektur Data Lake opartych na Databricks, PySpark i Delta Lake. To nie jest rola analityczna – oczekiwane jest inżynierskie podejście, znajomość czystego kodu, DevOps i pracy w Agile. Projekty dla sektora ubezpieczeń i automotive.
Brakuje: nie podano wielkości zespołu, brak opisu procesu rekrutacyjnego.
Rola łączy inżynierię danych z software engineeringiem. Będziesz projektować i budować skalowalne pipeliny danych na platformie Azure, migrować legacy SQL (głównie procedury składowane) do nowoczesnych architektur Data Lake opartych na Databricks, PySpark i Delta Lake. To nie jest rola analityczna – oczekiwane jest inżynierskie podejście, znajomość czystego kodu, DevOps i pracy w Agile. Projekty dla sektora ubezpieczeń i automotive.
- ✓Długoterminowe projekty enterprise (ubezpieczenia, automotive)
- ✓Praca z nowoczesnym stackiem (Azure, Databricks, PySpark, Delta Lake)
- ✓Możliwość wpływu na architekturę i standardy inżynierskie
- !Brak informacji o wielkości zespołu i liczbie projektów równoległych
- !Nie określono zakresu odpowiedzialności architektonicznej – czy to rola typowo wykonawcza, czy z wpływem na architekturę
- !Opis nie wspomina o dyżurach on-call – warto dopytać
- •Projektowanie i implementacja skalowalnych pipeline'ów danych na Azure (Data Factory, Databricks, Delta Lake)
- •Refaktoryzacja i optymalizacja przepływów ETL/ELT z legacy SQL do PySpark
- •Tłumaczenie złożonej logiki biznesowej (procedury składowane MS SQL) na Python/PySpark
- •Współpraca z zespołami produktowymi w Agile – daily, sprint planning, retrospektywy
- •Uczestniczenie w decyzjach architektonicznych dotyczących platformy danych
- •Kodowanie i przeprowadzanie code review
- •Utrzymywanie standardów jakości kodu (clean code, testy, CI/CD)
- •Debugowanie i optymalizacja wydajności pipeline'ów danych
Oferta dla doświadczonych specjalistów (Senior).
Inżynier z 3-4 latami doświadczenia w data engineering, praktyczną znajomością Databricks i PySpark, umiejący samodzielnie przepisać złożoną procedurę składowaną na Python/PySpark. Wymagane doświadczenie w migracji danych.
Osoby bez doświadczenia w migracji legacy SQL do Data Lake, które nie znają Databricks ani PySpark. Juniorzy bez solidnych podstaw w data engineering. Kandydaci szukający czysto analitycznej roli (BI/raportowanie).
- ?Ile osób liczy zespół, do którego dołączę?
- ?Czy praca jest w 100% zdalna, czy są spotkania okazjonalne?
- ?Jak wygląda proces rekrutacyjny – zadanie domowe, live coding?
- ?Czy przewidziane są dyżury on-call? Jeśli tak, jaka jest ich częstotliwość i rekompensata?
- ?Jaki jest główny projekt na starcie – ile osób, jaki stack, jaki etap rozwoju?
- ?Czy są plany rozwoju wewnętrznych narzędzi/bibliotek, czy głównie praca dla klienta?
- ?Jakie są możliwości rozwoju (szkolenia, konferencje, certyfikaty Azure)?
- −Nie podano wielkości zespołu
- −Brak opisu procesu rekrutacyjnego
- −Nie wiadomo, czy są benefity pozapłacowe (np. budżet szkoleniowy, prywatna opieka medyczna)
Praca w Agile z cross-funkcjonalnymi zespołami, nacisk na inżynierskie standardy i jakość kodu. Cluster Reply jest częścią dużej grupy Reply, co zapewnia stabilność i dostęp do różnych projektów.
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię Azure. Pełne statystyki zarobków →