Ładowanie...
Ładowanie...

Rola polega na budowaniu i utrzymaniu skalowalnych, metadata-driven pipeline'ów danych na platformie AWS z użyciem Apache Spark (EMR), Python/PySpark oraz SQL. Praca dla globalnej firmy zajmującej się weryfikacją kandydatów (background screening), obsługującej duże zbiory danych. Inżynier będzie odpowiedzialny za automatyzację procesów, optymalizację data lake, integrację strumieniową (Kafka/Kinesis) oraz rozwój bibliotek ETL. To stanowisko mid-level (regular) z naciskiem na samodzielność i współpracę między zespołami.