Data Engineer (GCP)
apreel
Rola Data Engineera skupiona na platformie Google Cloud Platform (GCP). Będziesz projektować i rozwijać pipeline'y danych, budować procesy ETL/ELT, pracować z BigQuery i optymalizować zapytania SQL, oraz tworzyć rozwiązania serverless z Cloud Run i Cloud Functions. Do codziennych zadań należy również orkiestracja workflow przy użyciu Cloud Composer (Apache Airflow), zarządzanie ingestią danych i monitorowanie jakości danych. Współpracujesz z zespołami analitycznymi, developerskimi i biznesowymi. To typowa rola inżyniera danych w chmurze, bez elementów data science czy machine learning – nacisk na infrastrukturę danych i przetwarzanie.
Brakuje: nie podano wielkości zespołu, brak opisu procesu rekrutacyjnego.
Rola Data Engineera skupiona na platformie Google Cloud Platform (GCP). Będziesz projektować i rozwijać pipeline'y danych, budować procesy ETL/ELT, pracować z BigQuery i optymalizować zapytania SQL, oraz tworzyć rozwiązania serverless z Cloud Run i Cloud Functions. Do codziennych zadań należy również orkiestracja workflow przy użyciu Cloud Composer (Apache Airflow), zarządzanie ingestią danych i monitorowanie jakości danych. Współpracujesz z zespołami analitycznymi, developerskimi i biznesowymi. To typowa rola inżyniera danych w chmurze, bez elementów data science czy machine learning – nacisk na infrastrukturę danych i przetwarzanie.
- ✓Pełna transparentność wynagrodzenia (stała stawka)
- ✓Współpraca długofalowa (brak projektu krótkoterminowego)
- ✓Benefity pozapłacowe: prywatna opieka zdrowotna z rehabilitacją, dodatkowe dni wolne dla rodziców, program kafeteryjny, wewnętrzny program szkoleń
- ✓Praca w pełni zdalna z elastycznością
- !Brak informacji o wielkości zespołu i strukturze projektów
- !Nie podano procesu rekrutacyjnego
- !Brak wzmianki o on-call lub dyżurach
- !Opis wymagań jest dość ogólny – warto doprecyzować oczekiwany poziom zaawansowania w poszczególnych technologiach
- •Projektowanie i implementacja pipeline'ów danych w GCP
- •Budowa i optymalizacja procesów ETL/ELT
- •Tworzenie optymalnych zapytań SQL w BigQuery
- •Rozwijanie rozwiązań serverless (Cloud Run, Cloud Functions)
- •Integracja danych z różnych źródeł i automatyzacja przepływów
- •Orkiestracja workflow z użyciem Cloud Composer (Apache Airflow)
- •Zarządzanie procesami ingestii danych do Cloud Storage
- •Monitorowanie jakości danych i walidacja procesów przetwarzania
Oferta dla doświadczonych specjalistów (Senior).
Inżynier danych z przynajmniej 3-4 latami doświadczenia w data engineering, w tym solidne podstawy GCP – umie samodzielnie zbudować pipeline w BigQuery i Pythonie, zna Airflow. Osoba, która uzupełni luki w zakresie serverless i zaawansowanego modelowania danych, ale ma praktykę w ETL i SQL.
Nie dla juniorów ani osób bez praktycznego doświadczenia z GCP i BigQuery. Rola wymaga samodzielności w projektowaniu architektury danych i optymalizacji wydajności, więc osoby z mniej niż 2-3 latami pracy w data engineering mogą mieć trudności z wymaganiami.
- ?Jak wygląda struktura zespołu – ile osób, kto jest bezpośrednim przełożonym?
- ?Czy projekt jest greenfield czy rozwijamy istniejącą platformę?
- ?Jakie są główne źródła danych i jaka jest ich skala (ilość danych, częstotliwość)?
- ?Czy w zespole stosowane są CI/CD i DataOps – jakie narzędzia?
- ?Jakie są godziny pracy i czy przewidziane są dyżury on-call?
- ?Jak wygląda proces onboardingu i wsparcie mentorów?
- ?Czy istnieje możliwość udziału w konferencjach lub szkoleniach zewnętrznych?
- −Nie podano wielkości zespołu
- −Brak opisu procesu rekrutacyjnego
- −Nie wiadomo, czy praca dotyczy jednego projektu czy kilku
- −Brak informacji o on-call lub dyżurach
- −Nie określono, czy wymagana jest znajomość specyficznych narzędzi CI/CD
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię GCP. Pełne statystyki zarobków →