Junior Big Data Developer (bankowość)
emagine
Rola junior data engineera w bankowości. Codzienna praca to tworzenie i utrzymanie pipeline'ów danych przy użyciu Apache Spark (Python/Scala) oraz ekosystemu Hadoop (Cloudera/Hortonworks). Integruje dane z różnych źródeł, zarządza formatami (JSON, Parquet, ORC, Avro) i zapewnia jakość danych. To stanowisko techniczne, wymagające znajomości hurtowni danych i pracy z dużymi zbiorami.
Brakuje: nazwa klienta końcowego, wielkość i struktura zespołu.
Rola junior data engineera w bankowości. Codzienna praca to tworzenie i utrzymanie pipeline'ów danych przy użyciu Apache Spark (Python/Scala) oraz ekosystemu Hadoop (Cloudera/Hortonworks). Integruje dane z różnych źródeł, zarządza formatami (JSON, Parquet, ORC, Avro) i zapewnia jakość danych. To stanowisko techniczne, wymagające znajomości hurtowni danych i pracy z dużymi zbiorami.
- ✓Nowoczesny stack Big Data: Spark, Kafka, Hadoop
- ✓Sektor bankowy zapewniający stabilność i długoterminowe projekty
- !Brak nazwy klienta końcowego (oferta od agencji rekrutacyjnej)
- !Niejasny zakres odpowiedzialności – rola może być mocno operacyjna
- !Brak informacji o wielkości zespołu i procesie rekrutacyjnym
- •Pisanie i optymalizacja zadań Spark w Pythonie lub Scali
- •Integracja danych z wielu źródeł (bazy, API, pliki) do spójnej architektury
- •Przetwarzanie i przechowywanie danych w formatach Parquet, Avro, ORC
- •Korzystanie z Hive, Kudu, HBase do zapytań i zarządzania danymi
- •Utrzymanie klastra Hadoop (Cloudera/Hortonworks)
- •Współpraca z zespołami analitycznymi w celu zapewnienia dostępności i jakości danych
- •Implementacja standardów kodowania, testowania i dokumentacji
- •Monitorowanie i debugowanie pipeline'ów danych
Oferta odpowiednia dla osób na początku kariery w IT.
Kandydat z dokładnie 2-letnim doświadczeniem IT, w tym 1 rok z Spark, podstawową znajomością Hadoop oraz biegłym SQL. Osoba gotowa do szybkiego wdrożenia w bankowy ekosystem danych.
Senior data engineer oczekujący wyższych stawek lub autonomii; osoby szukające pracy w pełni stacjonarnej; kandydaci preferujący role stricte produkcyjne z mniejszym naciskiem na integrację i utrzymanie.
- ?Jaki jest konkretny klient końcowy (nazwa banku)?
- ?Ile osób liczy zespół danych i jak wygląda podział ról?
- ?Czy istnieje system dyżurów (on-call) i jak często występują?
- ?Jak wygląda onboarding i wsparcie dla juniora?
- ?Czy są możliwości rozwoju (szkolenia, konferencje, certyfikaty)?
- ?Czy w projekcie używane są również inne technologie poza wymienionymi?
- −Nazwa klienta końcowego
- −Wielkość i struktura zespołu
- −Szczegółowy zakres projektu (np. legacy czy greenfield)
- −Proces rekrutacyjny (liczba etapów, czas oczekiwania, zadanie domowe?)
- −Benefity pozapłacowe (np. budżet szkoleniowy, prywatna opieka zdrowotna)