Data Engineer Data Lake
Makeitright
Rola Data Engineera skupiona na budowie i utrzymaniu Data Lake w chmurze GCP dla dużego banku. Będziesz projektować pipeline'y ETL/ELT dla danych strukturalnych i niestrukturalnych (audio, obrazy, dokumenty tekstowe), pracować z architekturami zdarzeniowymi (Kafka/Pub/Sub) oraz optymalizować wydajność. Współpraca z zespołami Data Science i AI przy wdrażaniu rozwiązań Generative AI. Mimo że dane strukturalne wskazują tryb stacjonarny, opis oferty mówi o hybrydzie (1-2 dni w biurze) – to rozbieżność do wyjaśnienia.
Brakuje: nie podano wielkości zespołu ani struktury projektu, brak opisu procesu rekrutacyjnego (liczba etapów, rodzaj zadań).
Rola Data Engineera skupiona na budowie i utrzymaniu Data Lake w chmurze GCP dla dużego banku. Będziesz projektować pipeline'y ETL/ELT dla danych strukturalnych i niestrukturalnych (audio, obrazy, dokumenty tekstowe), pracować z architekturami zdarzeniowymi (Kafka/Pub/Sub) oraz optymalizować wydajność. Współpraca z zespołami Data Science i AI przy wdrażaniu rozwiązań Generative AI. Mimo że dane strukturalne wskazują tryb stacjonarny, opis oferty mówi o hybrydzie (1-2 dni w biurze) – to rozbieżność do wyjaśnienia.
- ✓Strategiczny projekt dla największego banku w Polsce – stabilność i prestiż
- ✓Nowoczesny stack technologiczny (GCP, Big Data, Generative AI) – rozwój kompetencji
- ✓Możliwość wpływu na platformy danych wspierające AI
- −Rozbieżność między danymi strukturalnymi (office) a opisem (hybrydowa 1-2 dni w biurze) – należy doprecyzować realny model pracy
- −Rola realizowana przez firmę outsourcingową (MakeITRight) do banku – może to oznaczać mniejszy wpływ na decyzje techniczne i polityki korporacyjne
- !Brak informacji o wielkości zespołu, procesie rekrutacyjnym i on-call
- !Wymagania obejmują bardzo szeroki stack (Python/Rust, Kafka/Pub/Sub, BigQuery, Oracle, PostgreSQL, Linux) – ryzyko, że oczekiwany jest ekspert od wszystkiego
- !Długoterminowość współpracy nie jest gwarantowana – umowa B2B z outsourcingiem
- •Projektowanie i rozwój rozwiązań Data Lake w GCP
- •Tworzenie wydajnych pipeline'ów do przetwarzania danych strukturalnych i niestrukturalnych (audio, obrazy, dokumenty)
- •Projektowanie oraz optymalizacja baz danych w Google BigQuery, Oracle, PostgreSQL
- •Implementacja architektur opartych na przetwarzaniu zdarzeń z użyciem Apache Kafka lub Google Pub/Sub
- •Współpraca z zespołami Data Science, AI i Software Engineering
- •Optymalizacja wydajności procesów ETL/ELT oraz środowisk Big Data
- •Współtworzenie rozwiązań wspierających technologie Generative AI
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Osoba z podstawowym doświadczeniem w Data Lake i Pythonie, która zna GCP (BigQuery) i jeden z systemów zdarzeniowych (Kafka/Pub/Sub). Może mieć mniej doświadczenia z Oracle/PostgreSQL lub GenAI, ale ma solidne podstawy w przetwarzaniu danych.
Nie dla juniorów z mniej niż 2-3 latami doświadczenia w Data Engineering, którzy nie pracowali z Data Lake ani nie znają GCP. Osoby oczekujące wyłącznie pracy zdalnej (strukturalny wpis 'office' sugeruje stacjonarnie, choć opis mówi inaczej – ryzyko rozbieżności).
- ?Jaki jest realny model pracy – stacjonarny czy hybrydowy? W danych widnieje 'office', a w opisie '1-2 dni w biurze'.
- ?Ile osób liczy zespół Data Engineering i jak są podzielone role?
- ?Czy istnieje dyżur on-call? Jak często i czy jest dodatkowo płatny?
- ?Jak wygląda proces rekrutacyjny – ile etapów, czy jest zadanie domowe lub live coding?
- ?Jaki jest planowany czas trwania projektu i stabilność współpracy B2B?
- ?Czy praca odbywa się bezpośrednio u klienta (banku) czy w biurze MakeITRight?
- ?Jakie są benefity poza wymienionymi (np. budżet szkoleniowy, konferencje)?
- −Nie podano wielkości zespołu ani struktury projektu
- −Brak opisu procesu rekrutacyjnego (liczba etapów, rodzaj zadań)
- −Nie wiadomo czy istnieje obowiązek dyżurów on-call
- −Nie wymieniono benefitów (oprócz standardowych – opieka medyczna itp. nie są wymienione)
- −Nie sprecyzowano, czy praca odbywa się w biurze MakeITRight czy u klienta bankowego
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →