Data Platform Engineer
Link Group
Rola skupia się na budowie i utrzymaniu platformy danych w chmurze (Azure/GCP). Będziesz projektować i implementować strumieniowe i batchowe potoki danych, automatyzować zarządzanie schematami (Avro, Schema Registry), dbać o jakość i pochodzenie danych oraz udostępniać gotowe szablony dla innych zespołów. To rola inżynierska, łącząca data engineering z platform engineering i infrastrukturą (Kubernetes, IaC).
Brakuje: wielkość zespołu i struktura organizacyjna, czy praca dotyczy własnego produktu czy projektu klienta.
Rola skupia się na budowie i utrzymaniu platformy danych w chmurze (Azure/GCP). Będziesz projektować i implementować strumieniowe i batchowe potoki danych, automatyzować zarządzanie schematami (Avro, Schema Registry), dbać o jakość i pochodzenie danych oraz udostępniać gotowe szablony dla innych zespołów. To rola inżynierska, łącząca data engineering z platform engineering i infrastrukturą (Kubernetes, IaC).
- ✓W pełni zdalnie (remote)
- ✓Wynagrodzenie podane wprost (B2B)
- ✓Nowoczesny stack: streaming, chmura, IaC, GitOps
- ✓Możliwość budowania platformy od podstaw – greenfield?
- ✓Rola wymaga autonomii technicznej
- !Brak informacji o wielkości zespołu i strukturze projektów
- !Nie wiadomo, czy pracujesz nad własnym produktem, czy dla klientów zewnętrznych
- !Firma ma 40+ osób – możliwy startupowy lub consultingowy charakter
- •Projektowanie i budowa strumieniowych potoków danych (Event Hub/Kafka → streaming processing z Beam lub Azure Stream Analytics)
- •Implementacja batchowych potoków ETL do BigQuery lub Azure Synapse
- •Automatyzacja generowania SDK z Avro/Schema Registry oraz obsługa ewolucji schematów
- •Implementacja mechanizmów jakości danych, pochodzenia (lineage) i zarządzania danymi (governance)
- •Tworzenie samoobsługowych szablonów potoków danych dla developerów
- •Zarządzanie infrastrukturą za pomocą Terraform/Bicep i Kubernetes (GitOps, CI/CD)
- •Debugowanie i optymalizacja wydajności potoków danych
Oferta dla doświadczonych specjalistów (Senior).
Mid-level data engineer z 3+ latami doświadczenia w SQL i Pythonie, znający Sparka i jedną z chmurowych hurtowni danych (BigQuery lub Synapse), z podstawową znajomością Kafki i Kubernetes.
Juniorzy bez doświadczenia w streamingu i chmurze, a także osoby szukające typowej roli backend developera czy analityka danych – tutaj kod piszesz pod kątem infrastruktury danych.
- ?Ile osób liczy zespół data platform i jakie są role w zespole?
- ?Czy pracujemy nad własnym produktem, czy dla klientów?
- ?Jaki jest tryb on-call? Czy są dyżury?
- ?Jak wygląda proces decyzyjny przy wyborze technologii?
- ?Czy jest budżet na rozwój i konferencje?
- ?Jakie są główne wyzwania techniczne na start?
- ?Czy GitOps i CI/CD są już wdrożone, czy to nowa inicjatywa?
- −Wielkość zespołu i struktura organizacyjna
- −Czy praca dotyczy własnego produktu czy projektu klienta
- −Proces rekrutacyjny (liczba etapów, zadanie domowe?)
- −On-call lub dyżury produkcyjne
- −Dostępność budżetu szkoleniowego
- −Plany rozwoju platformy na najbliższe miesiące
Poniżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię SQL. Pełne statystyki zarobków →