Data Engineer (Fulfillment)
Tesco Technology
Rola polega na budowaniu i utrzymaniu pipeline'ów danych dla działu fulfillment (realizacja zamówień) w Tesco. Będziesz pracować z dużymi zbiorami danych w ekosystemie Hadoop/Spark, optymalizować przepływy danych i integrować się z zespołami analitycznymi i data science. To klasyczna rola Data Engineera w dużym przedsiębiorstwie detalicznym.
Brakuje: nie podano wielkości zespołu, brak opisu procesu rekrutacyjnego.
Rola polega na budowaniu i utrzymaniu pipeline'ów danych dla działu fulfillment (realizacja zamówień) w Tesco. Będziesz pracować z dużymi zbiorami danych w ekosystemie Hadoop/Spark, optymalizować przepływy danych i integrować się z zespołami analitycznymi i data science. To klasyczna rola Data Engineera w dużym przedsiębiorstwie detalicznym.
- ✓Premia roczna do 20% wynagrodzenia
- ✓Umowa na stałe od początku
- ✓Dodatkowe 4 dni płatnego urlopu na wellbeing
- ✓MacBook jako narzędzie pracy
- ✓Certyfikowane szkolenia techniczne i platforma Udemy
- −Sprzeczność między danymi strukturalnymi (office) a opisem (hybryda 60% w biurze) – niejasny model pracy
- !Szeroki zestaw wymaganych technologii – ryzyko bycia 'jack of all trades'
- !Możliwość pracy z legacy systemami w dużym przedsiębiorstwie
- !Brak informacji o on-call i dyżurach
- •Projektowanie i rozwijanie pipeline'ów danych w Apache Spark (Scala lub Python)
- •Praca z HDFS i S3 do przechowywania danych
- •Orkiestracja zadań w Apache Airflow
- •Automatyzacja procesów ETL i optymalizacja wydajności
- •Współpraca z data scientistami i analitykami przy tworzeniu narzędzi analitycznych
- •Utrzymanie infrastruktury danych na klastrze Hadoop (YARN, Hive/Kyuubi)
- •Debugowanie i rozwiązywanie problemów z przepływem danych
- •Udział w spotkaniach z interesariuszami (Product, Data, Design)
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Inżynier danych z 2 latami doświadczenia, znający podstawy Spark i Python/PySpark, chętny do nauki Scala i ekosystemu Hadoop.
Juniorzy bez praktycznego doświadczenia ze Spark i Hadoop. Osoby szukające pracy w pełni zdalnej (ogłoszenie wskazuje pracę biurową).
- ?Jaki jest model pracy – czy ostatecznie jest to hybryda, czy pełne biuro?
- ?Ile osób liczy zespół Data Engineering ds. fulfillment?
- ?Czy na co dzień pracujemy głównie z on-prem Hadoop, czy też z chmurą (AWS/Azure)?
- ?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe?
- ?Czy istnieje dyżur on-call? Jak często?
- ?Jaka jest skala danych – ile TB/Dziennie?
- ?Czy projekty są w większości greenfield, czy utrzymanie legacy?
- ?Jakie są najbliższe plany rozwoju architektury danych w zespole?
- −Nie podano wielkości zespołu
- −Brak opisu procesu rekrutacyjnego
- −Nie wiadomo, czy praca dotyczy wyłącznie on-prem, czy także chmury
- −Brak informacji o on-call
- −Nie określono konkretnego cloud providera (mimo wzmianki o 'cloud alternative')
Współpraca z wieloma zespołami (Product, Data, Design) i nacisk na samodzielność oraz optymalizację procesów.
Powyżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →