Data Engineer
Andersen
Jako Data Engineer w Andersen będziesz pracować nad platformą analityczną dla branży mediowej i reklamowej. Twoja codzienna praca to głównie SQL do walidacji danych, konfiguracja środowisk AWS (S3, IAM, SFTP), pisanie DAG-ów w Airflow oraz koordynacja z partnerami zewnętrznymi w kwestiach dostarczania danych. Rola ma charakter wsparcia i utrzymania istniejących pipeline'ów, a nie budowy nowych od zera.
Brakuje: nie podano wielkości zespołu ani struktury raportowania, brak opisu procesu rekrutacyjnego (etapy, czas).
Jako Data Engineer w Andersen będziesz pracować nad platformą analityczną dla branży mediowej i reklamowej. Twoja codzienna praca to głównie SQL do walidacji danych, konfiguracja środowisk AWS (S3, IAM, SFTP), pisanie DAG-ów w Airflow oraz koordynacja z partnerami zewnętrznymi w kwestiach dostarczania danych. Rola ma charakter wsparcia i utrzymania istniejących pipeline'ów, a nie budowy nowych od zera.
- ✓Certyfikacja (AWS, PMP) dofinansowana
- ✓Dostęp do korporacyjnego portalu szkoleniowego
- ✓Program poleceń (referral) i bonusy za udział w aktywnościach firmy
- ✓Prywatna opieka zdrowotna i dofinansowanie sportu
- −Niespójność w trybie pracy: strukturalne dane wskazują 'office', natomiast opis oferty mówi o możliwości pracy zdalnej/hybrydowej – warto wyjaśnić przed aplikacją
- −Rola może mieć charakter wsparcia (głównie walidacja, poprawianie danych, kontakt z partnerami), a nie rozwijania nowych funkcjonalności
- !Rola wymaga doświadczenia z systemami strumieniowymi/event-driven, ale w obowiązkach nie ma tego wprost – może być ukryte w pipeline'ach
- !Dużo koordynacji z partnerami zewnętrznymi, co może wiązać się z częstymi spotkaniami i presją czasu
- !Firma outsourcingowa – zmiana projektu możliwa, ale brak gwarancji stabilności długoterminowej
- •Pisanie i wykonywanie złożonych zapytań SQL (BigQuery, PostgreSQL) w celu walidacji raportów i izolacji anomalii
- •Reprodukowanie i dokumentowanie problemów z danymi, koordynacja z zespołem DE w celu ich rozwiązania
- •Konfiguracja środowisk chmurowych dla dostarczania danych partnerom (bucket S3, polityki IAM, endpoint SFTP)
- •Tworzenie i utrzymanie DAG-ów w Apache Airflow (Python) do orkiestracji przepływów danych
- •Koordynacja z partnerami w kwestii formatów plików, harmonogramów dostaw i testów zbiorów danych
- •Wykonywanie testów dopasowania (match tests) w celu walidacji rozpoznawania tożsamości w pipeline'ach
- •Identyfikacja i raportowanie problemów z jakością danych w plikach partnerskich przed ich propagacją do produkcji
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Inżynier danych z 3 letnim doświadczeniem, solidnym SQL i Pythonem, który pracował produkcyjnie z AWS lub Databricks i pisał DAG-i w Airflow. Osoba, która radzi sobie z komunikacją i rozwiązywaniem problemów.
Nie dla juniorów poniżej 3 lat doświadczenia. Rola nie jest odpowiednia dla osób szukających pełnej autonomii w budowie nowych systemów – duży nacisk na wsparcie i walidację istniejących rozwiązań.
- ?Ile osób liczy zespół DE, w którym będę pracować?
- ?Jaki procent czasu to praca nad nowymi pipeline'ami vs. wsparcie istniejących?
- ?Czy jest dyżur on-call? Jak wygląda harmonogram?
- ?Jaki jest przewidywany czas trwania projektu?
- ?Czy rzeczywiście istnieje możliwość pracy zdalnej, skoro w ogłoszeniu jest 'office'?
- ?Jakie narzędzia do streamingu/event-driven są używane? (np. Kafka, Kinesis?)
- −Nie podano wielkości zespołu ani struktury raportowania
- −Brak opisu procesu rekrutacyjnego (etapy, czas)
- −Nie wiadomo, czy rola wiąże się z dyżurami on-call
- −Brak informacji o długości projektu i możliwości zmiany projektu w przyszłości
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię AWS. Pełne statystyki zarobków →