Cloud Data Engineer (AWS)
Reply Polska
Rola polega na projektowaniu i wdrażaniu chmurowych platform danych w AWS, głównie poprzez budowę potoków ETL/ELT z użyciem PySpark i AWS Glue. Praca odbywa się w ramach Machine Learning Reply, jednostki Reply Polska, która realizuje projekty data science i inżynierii danych dla niemieckich klientów korporacyjnych (HDAX). Nie chodzi o uczenie maszynowe – to typowa rola data engineera, a nie ML engineera. Stack to AWS, Python, PySpark, okazjonalnie Java i inne technologie big data.
Brakuje: nie podano wielkości zespołu ani struktury projektów, brak informacji o procesie rekrutacyjnym.
Rola polega na projektowaniu i wdrażaniu chmurowych platform danych w AWS, głównie poprzez budowę potoków ETL/ELT z użyciem PySpark i AWS Glue. Praca odbywa się w ramach Machine Learning Reply, jednostki Reply Polska, która realizuje projekty data science i inżynierii danych dla niemieckich klientów korporacyjnych (HDAX). Nie chodzi o uczenie maszynowe – to typowa rola data engineera, a nie ML engineera. Stack to AWS, Python, PySpark, okazjonalnie Java i inne technologie big data.
- ✓Dostęp do platformy językowej i regularnych szkoleń
- ✓Płaska struktura i praca w małych zespołach
- ✓Projekty międzynarodowe – praca z klientami z Niemiec
- −Wymagana jest zarówno Java, jak i Python, a także Azure obok AWS – zakres może być zbyt szeroki dla jednej osoby.
- !Nie podano wielkości zespołu ani liczby projektów równoległych.
- !Certyfikat AWS jest 'preferred' ale nie wymagany – może być oczekiwany po zatrudnieniu.
- !Wymieniono wiele technologii (Kafka, Flink) bez wskazania, czy są faktycznie używane.
- •Projektowanie i implementacja rozwiązań do przetwarzania danych w AWS (np. S3, Glue, EMR, Redshift)
- •Tworzenie i utrzymywanie potoków ETL/ELT z użyciem PySpark
- •Konfiguracja i zarządzanie zadaniami AWS Glue oraz katalogiem danych
- •Monitorowanie wydajności potoków danych i rozwiązywanie problemów
- •Współpraca z inżynierami oprogramowania i interesariuszami w celu tłumaczenia wymagań biznesowych na rozwiązania techniczne
- •Pisanie i utrzymywanie dokumentacji technicznej oraz najlepszych praktyk
- •Udział w spotkaniach zespołowych i planowaniu sprintów
- •Okazjonalne wizyty w biurze w Katowicach (raz na dwa miesiące)
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Inżynier danych z przynajmniej 2-letnim doświadczeniem w AWS i ETL, znający Pythona i PySpark, gotowy do regularnych wizyt w biurze w Katowicach.
Juniorzy bez komercyjnego doświadczenia w chmurze, osoby szukające pracy w pełni zdalnej, ani specjaliści od uczenia maszynowego (rola jest czysto data-engineering).
- ?Ile osób liczy zespół data engineering i nad iloma projektami pracuje jednocześnie?
- ?Czy Java jest faktycznie używana na co dzień, czy to tylko wymóg formalny?
- ?Jak często faktycznie wymagana jest obecność w biurze – czy to raz na dwa miesiące, czy częściej?
- ?Jaki jest typowy klient i branża (np. finanse, automotive)?
- ?Czy certyfikat AWS jest wymagany do rozpoczęcia, czy firma go sponsoruje?
- ?Jak wygląda proces rekrutacyjny (etapy, zadanie domowe)?
- ?Czy są dyżury on-call lub praca w weekendy?
- ?Jakie są możliwości awansu i ścieżka kariery?
- −Nie podano wielkości zespołu ani struktury projektów
- −Brak informacji o procesie rekrutacyjnym
- −Nie wiadomo, czy wszystkie technologie z 'must have' są używane na co dzień
- −Brak danych o liczbie dni pracy zdalnej w modelu hybrydowym (mimo że strukturalnie jest 'office')
- −Nie określono, czy wymagane są dyżury on-call
Małe zespoły, płaska struktura, praca nad międzynarodowymi projektami dla niemieckich korporacji. Firma kładzie nacisk na rozwój i szkolenia.
Poniżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →