Senior Big Data Engineer (Python + AWS)
Grid Dynamics
To rola senior data engineera odpowiedzialnego za budowę i utrzymanie nowoczesnej platformy danych w chmurze AWS. Będziesz projektować i implementować złożone pipeline'y ETL/ELT w PySpark, zarządzać infrastrukturą chmurową przez AWS CDK, oraz wdrażać architekturę data lakehouse z Apache Iceberg i Redshift. Praca wymaga łączenia głębokiej wiedzy Big Data z umiejętnościami inżynierii chmury i DevOps – to rola dla kogoś, kto lubi mieć pełną kontrolę nad stosem technologicznym.
Brakuje: nie opisano procesu rekrutacyjnego, nie wiadomo, czy to projekt greenfield czy brownfield.
To rola senior data engineera odpowiedzialnego za budowę i utrzymanie nowoczesnej platformy danych w chmurze AWS. Będziesz projektować i implementować złożone pipeline'y ETL/ELT w PySpark, zarządzać infrastrukturą chmurową przez AWS CDK, oraz wdrażać architekturę data lakehouse z Apache Iceberg i Redshift. Praca wymaga łączenia głębokiej wiedzy Big Data z umiejętnościami inżynierii chmury i DevOps – to rola dla kogoś, kto lubi mieć pełną kontrolę nad stosem technologicznym.
- ✓Praca z najnowszymi technologiami (Iceberg, CDK, MWAA)
- ✓Możliwość rozwoju zawodowego i szkoleń
- ✓Własność nad platformą – autonomia techniczna
- ✓Duża firma (500+), stabilność zatrudnienia
- −Firma outsourcingowa (Grid Dynamics) – projekty u klientów mogą wiązać się z mniejszą stabilnością i zmianami priorytetów
- −Brak informacji o konkretnym projekcie/kliencie – nie wiadomo, czy pracujesz nad greenfieldem, czy legacy
- !Nie podano liczby dni w biurze w modelu hybrydowym
- !Brak opisu procesu rekrutacyjnego i liczby etapów
- !Nie wiadomo, czy istnieje dyżur on-call
- !Brak informacji o wielkości zespołu i strukturze
- !Nie sprecyzowano, czy stos technologiczny to wybór zespołu, czy narzucony przez klienta
- •Projektowanie i implementacja pipeline'ów do pozyskiwania i transformacji danych w PySpark/Apache Spark
- •Zarządzanie środowiskiem AWS (VPC, EMR, ECS, Lambda, S3) przy użyciu AWS CDK i CLI
- •Tworzenie i utrzymywanie złożonych workflows w Airflow (MWAA) i AWS Step Functions
- •Implementacja warstwy przechowywania danych z Apache Iceberg i Redshift według Medallion Architecture
- •Monitorowanie i optymalizacja wydajności zapytań w Athena, Glue i RDS
- •Pisanie skryptów Bash do automatyzacji systemowej i integracji REST API
- •Zarządzanie bezpieczeństwem i zgodnością przez IAM, KMS i Secret Manager
- •Code review i współpraca z zespołem nad architecturem platformy
Oferta dla doświadczonych specjalistów (Senior).
Mid-level data engineer z solidnym Pythonem i przynajmniej 3-letnim doświadczeniem z AWS, który potrafi samodzielnie budować proste pipeline'y w PySpark i zarządzać Airflow, ale potrzebuje jeszcze mentoringu przy bardziej złożonej architekturze.
Juniorzy bez doświadczenia w Big Data i AWS, osoby szukające wyłącznie pracy zdalnej (model hybrydowy), ani deweloperzy preferujący backend bez chmury.
- ?Ile dni w tygodniu trzeba być w biurze w Krakowie?
- ?Jaki jest konkretny projekt/klient – czy to greenfield, czy rozwijany system?
- ?Ile osób liczy zespół data engineering i jaka jest struktura?
- ?Czy jest przewidziany dyżur on-call? Jak często?
- ?Jaki jest stosunek pracy nad pipeline'ami do zarządzania infrastrukturą?
- ?Czy istnieje budżet na konferencje/certyfikacje?
- ?Jak długo trwa średnio projekt u klienta?
- ?Czy stos technologiczny jest stały, czy może się zmieniać w zależności od projektu?
- −Nie opisano procesu rekrutacyjnego
- −Nie wiadomo, czy to projekt greenfield czy brownfield
- −Brak informacji o wielkości zespołu
- −Nie wspomniano o polityce on-call
- −Nie określono ścieżki rozwoju (senior → lead?)
W ogłoszeniu opisano zespół jako 'highly motivated and dedicated team' – oczekuje się zaangażowania i samodzielności w technologiach cloud/big data. Prawdopodobnie kultura nastawiona na współpracę i dzielenie się wiedzą.
Powyżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →