Data Engineer - Data Platform

Allegro

Oferta w skrócie

Widełki nieujawnione

🔀HybrydowaTryb pracy

📄Umowa o pracęKontrakt

⏱️Mid · 3+ latDoświadczenie

LokalizacjaWarszawa

Źródło

JustJoinIT

↗

Aktywna

Opublikowano17 czerwca 2026

Ostatnio sprawdzono17 czerwca 2026

Wygasa za87 dni

Otwórz ofertę u źródła

Werdykt JobHunt

Rola w zespole Vento odpowiedzialnym za standardyzację i walidację wszystkich zdarzeń clickstream na Allegro. Będziesz projektować i utrzymywać pipeline'y walidacji danych wysokiej objętości, implementować mechanizmy wykrywania anomalii oraz dbać o jakość danych używanych przez AI i kluczowe dashboardy. Praca na dużą skalę (petabajty danych, setki tysięcy zdarzeń na sekundę). Stack to głównie Python i Spark, z elementami Javy.

Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.

Brakuje: nie podano szczegółów procesu rekrutacyjnego, brak informacji o wielkości zespołu.

🛠 Wymagane technologie

Dane źródłowe

Big Data Python Spark Scala JavaAI

AI Insights

Czym naprawdę jest ta rola?Data Engineer

Plusy

✓Praca na ogromną skalę (petabajty danych, setki tysięcy rps)
✓Autonomia techniczna i wybór technologii
✓Nowoczesne narzędzia (Kubernetes, Docker, GitHub Actions)
✓Budżet szkoleniowy, hackathony, wewnętrzna platforma edukacyjna
✓Wsparcie AI w codziennej pracy (automatyzacja zadań)
✓30 dni okazyjnej pracy zdalnej rocznie

Na co uważać

!Brak informacji o dyżurach on-call
!Model hybrydowy 4 dni w biurze/1 dzień zdalnie (mało elastyczny dla zdalnych)
!Otwartość na Javę może oznaczać konieczność pracy z Java backendem
!Nie podano widełek wynagrodzenia (ale to może wynikać z polityki Allegro)

?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji

Codzienna praca

•Projektowanie, skalowanie i utrzymywanie pipeline'ów walidacji danych dla clickstreamu.
•Implementacja mechanizmów wykrywania anomalii w strumieniach danych.
•Współpraca z interesariuszami w celu uzgodnienia wymagań danych.
•Code review i aktywne uczestnictwo w dyskusjach inżynierskich.
•Używanie narzędzi AI do automatyzacji powtarzalnych zadań.
•Praca z platformą wewnętrzną (Kubernetes, Docker, GitHub Actions).
•Udział w usprawnianiu jakości danych dla konsumpcji przez AI i analitykę.

Więcej o ofercie

Dla kogo jest ta oferta

Profil idealny

Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).

Minimum sensowne

Osoba z 2-3 latami doświadczenia w Data Engineering, solidną znajomością Pythona i Spark, gotowa rozwijać się w obszarze jakości danych i streamingu.

Raczej nie dla

Osoby bez produkcyjnego doświadczenia w Big Data i Spark. Juniorzy bez umiejętności samodzielnej pracy nad złożonymi pipeline'ami.

Ocena dopasowania

Junior1/5

Mid4/5

Senior4/5

Hands-on5/5

Architekt2/5

Remote1/5

Enterprise5/5

Pytania do rekrutera

?Ile osób liczy zespół Vento?
?Jak wygląda proces rekrutacyjny (etapy, zadanie domowe)?
?Czy są dyżury on-call? Jeśli tak, jaka częstotliwość?
?Jakie jest średnie opóźnienie w pipeline'ach (latency)?
?Czy na co dzień będę pracować z kodem Java, czy tylko Python/Spark?
?Jak mierzona jest jakość danych i sukces w tej roli?
?Czy istnieje możliwość pełniejszej pracy zdalnej po okresie wdrożenia?
?Jaka część pracy to rozwój vs utrzymanie?

Brakujące informacje

−Nie podano szczegółów procesu rekrutacyjnego
−Brak informacji o wielkości zespołu
−Nie wiadomo czy są dyżury on-call
−Nie sprecyzowano oczekiwanego poziomu seniority (regular to mid/senior?)

Zespół

Kultura oparta na autonomii, feedbacku i ciągłym rozwoju. Zespół składa się z topowych specjalistów, którzy dzielą się wiedzą. Duży nacisk na code review i współpracę między zespołami.

Powiązane strony

Praca Big Data →Zarobki Big Data →Praca Big Data Warszawa →

🔗Podobne oferty