Data Engineer - Data Platform
Allegro
Rola w zespole Vento odpowiedzialnym za standardyzację i walidację wszystkich zdarzeń clickstream na Allegro. Będziesz projektować i utrzymywać pipeline'y walidacji danych wysokiej objętości, implementować mechanizmy wykrywania anomalii oraz dbać o jakość danych używanych przez AI i kluczowe dashboardy. Praca na dużą skalę (petabajty danych, setki tysięcy zdarzeń na sekundę). Stack to głównie Python i Spark, z elementami Javy.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: nie podano szczegółów procesu rekrutacyjnego, brak informacji o wielkości zespołu.
Rola w zespole Vento odpowiedzialnym za standardyzację i walidację wszystkich zdarzeń clickstream na Allegro. Będziesz projektować i utrzymywać pipeline'y walidacji danych wysokiej objętości, implementować mechanizmy wykrywania anomalii oraz dbać o jakość danych używanych przez AI i kluczowe dashboardy. Praca na dużą skalę (petabajty danych, setki tysięcy zdarzeń na sekundę). Stack to głównie Python i Spark, z elementami Javy.
- ✓Praca na ogromną skalę (petabajty danych, setki tysięcy rps)
- ✓Autonomia techniczna i wybór technologii
- ✓Nowoczesne narzędzia (Kubernetes, Docker, GitHub Actions)
- ✓Budżet szkoleniowy, hackathony, wewnętrzna platforma edukacyjna
- ✓Wsparcie AI w codziennej pracy (automatyzacja zadań)
- ✓30 dni okazyjnej pracy zdalnej rocznie
- !Brak informacji o dyżurach on-call
- !Model hybrydowy 4 dni w biurze/1 dzień zdalnie (mało elastyczny dla zdalnych)
- !Otwartość na Javę może oznaczać konieczność pracy z Java backendem
- !Nie podano widełek wynagrodzenia (ale to może wynikać z polityki Allegro)
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie, skalowanie i utrzymywanie pipeline'ów walidacji danych dla clickstreamu.
- •Implementacja mechanizmów wykrywania anomalii w strumieniach danych.
- •Współpraca z interesariuszami w celu uzgodnienia wymagań danych.
- •Code review i aktywne uczestnictwo w dyskusjach inżynierskich.
- •Używanie narzędzi AI do automatyzacji powtarzalnych zadań.
- •Praca z platformą wewnętrzną (Kubernetes, Docker, GitHub Actions).
- •Udział w usprawnianiu jakości danych dla konsumpcji przez AI i analitykę.
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Osoba z 2-3 latami doświadczenia w Data Engineering, solidną znajomością Pythona i Spark, gotowa rozwijać się w obszarze jakości danych i streamingu.
Osoby bez produkcyjnego doświadczenia w Big Data i Spark. Juniorzy bez umiejętności samodzielnej pracy nad złożonymi pipeline'ami.
- ?Ile osób liczy zespół Vento?
- ?Jak wygląda proces rekrutacyjny (etapy, zadanie domowe)?
- ?Czy są dyżury on-call? Jeśli tak, jaka częstotliwość?
- ?Jakie jest średnie opóźnienie w pipeline'ach (latency)?
- ?Czy na co dzień będę pracować z kodem Java, czy tylko Python/Spark?
- ?Jak mierzona jest jakość danych i sukces w tej roli?
- ?Czy istnieje możliwość pełniejszej pracy zdalnej po okresie wdrożenia?
- ?Jaka część pracy to rozwój vs utrzymanie?
- −Nie podano szczegółów procesu rekrutacyjnego
- −Brak informacji o wielkości zespołu
- −Nie wiadomo czy są dyżury on-call
- −Nie sprecyzowano oczekiwanego poziomu seniority (regular to mid/senior?)
Kultura oparta na autonomii, feedbacku i ciągłym rozwoju. Zespół składa się z topowych specjalistów, którzy dzielą się wiedzą. Duży nacisk na code review i współpracę między zespołami.