Senior Data Engineer (GenAI / LLM)
DCG
Rola łączy klasyczne data engineering (Kafka, SQL, batch/stream processing) z budowaniem automatyzacji opartej na LLM do poprawy produktywności inżynierów. Będziesz projektować i wdrażać asystentów AI do code review, generowania testów, walidacji schematów oraz zarządzać pipeline'ami danych w architekturze zdarzeniowej. Pracujesz dla agencji rekrutacyjnej, więc realnie zostaniesz przypisany do klienta – prawdopodobnie z sektora bankowego/regulowanego.
Brakuje: nie podano konkretnego klienta, brak informacji o wielkości zespołu.
Rola łączy klasyczne data engineering (Kafka, SQL, batch/stream processing) z budowaniem automatyzacji opartej na LLM do poprawy produktywności inżynierów. Będziesz projektować i wdrażać asystentów AI do code review, generowania testów, walidacji schematów oraz zarządzać pipeline'ami danych w architekturze zdarzeniowej. Pracujesz dla agencji rekrutacyjnej, więc realnie zostaniesz przypisany do klienta – prawdopodobnie z sektora bankowego/regulowanego.
- −Agencja rekrutacyjna – nie wiadomo kto jest klientem, jakie są warunki projektu i czy zmiana projektu jest możliwa
- −Brak informacji o procesie rekrutacyjnym i konkretnym kliencie
- !Wymienione technologie to dość szeroki stack (Bazel, Tekton, Flink, Spark) – ryzyko 'listy życzeń'
- !Nice-to-have obejmuje bankowość/regulacje – może to sugerować biurokratyczne środowisko
- •Projektowanie i implementacja workflow z wykorzystaniem LLM/GenAI do automatyzacji przeglądów kodu i kontroli jakości
- •Budowa i utrzymanie pipeline'ów AI w procesach CI/CD (np. automatyzacja zatwierdzania PR, generowanie testów E2E)
- •Tworzenie i zarządzanie pipeline'ami przetwarzania danych z użyciem Apache Kafka i transformacji SQL
- •Implementacja batch/stream processing z użyciem Flink lub Spark
- •Zarzadzanie cyklem życia schematów (JSON/Avro/XSD) – walidacja, versioning, kompatybilność
- •Pisanie i utrzymanie kodu w Pythonie do automatyzacji inżynieryjnych
- •Praca z Kubernetes, Bazel i Tekton do budowania i wdrażania pipeline'ów
- •Aktualizacja dokumentacji architektonicznej (Architecture Decision Records)
Oferta dla doświadczonych specjalistów (Senior).
Mid-level data engineer z minimum 3-4 latami doświadczenia, który ma podstawy w Kafka i SQL, zna Flink/Spark oraz próbował już budować automatyzacje z użyciem LLM (np. poprzez API OpenAI/Claude). Musi być gotowy do szybkiego rozwoju w kierunku AI-driven engineering.
Juniorzy bez doświadczenia w data engineering i LLM. Osoby szukające wyłącznie pracy zdalnej (hybryda w Gdańsku) oraz inżynierowie niezainteresowani automatyzacją opartą na AI. Również nie dla osób, które wolą pracę nad własnym produktem – to jest model agencyjny.
- ?Kim jest klient końcowy i w jakiej branży działa?
- ?Ile osób liczy zespół, do którego dołączę?
- ?Jaki jest planowany czas trwania projektu?
- ?Czy przewidziane są dyżury on-call? Jeśli tak, jak często i czy dodatkowo płatne?
- ?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe?
- ?Czy w projekcie pracuję głównie z LLMami (np. integracja z OpenAI) czy bardziej z data engineering?
- ?Czy istnieje możliwość pracy zdalnej w niektóre dni, czy hybryda jest sztywna?
- −Nie podano konkretnego klienta
- −Brak informacji o wielkości zespołu
- −Nie wiadomo, czy praca jest na jednym projekcie czy rotacyjnie
- −Brak opisu procesu rekrutacyjnego
- −Nie wiadomo o ewentualnych dyżurach on-call
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →