Pomiń do treści
Logo firmy emagine

Data Engineer (on prem)

emagine

Oferta w skrócie
Widełki nieujawnione
🏠ZdalnieTryb pracy
📄B2BKontrakt
⏱️Mid · 3+ latDoświadczenie
LokalizacjaWarszawa
Źródło
Aktywna
Opublikowano23 kwietnia 2026
Ostatnio sprawdzono6 maja 2026
Wygasa za45 dni
Werdykt JobHunt

Rola Data Engineera pracującego na infrastrukturze on-prem, odpowiedzialnego za projektowanie, budowę i utrzymanie skalowalnych pipeline'ów danych w środowisku hybrydowym (on-prem + chmura? choć ogłoszenie mówi 'hybrid environments' i 'on-prem data platforms'). Główny nacisk na technologie Kubernetes, Spark oraz Cloudera. Praca w małym, seniorskim zespole, zdalnie, dla klientów nordyckich. Rola obejmuje również udział w budowie produktów danych wspieranych AI.

Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.

Brakuje: nie podano widełek wynagrodzenia, brak informacji o budżecie szkoleniowym.

🛠 Wymagane technologie
Dane źródłowe
ClouderaKubernetesSpark or similarAirbyteDevelopment & data transformationsOn-prem data platformsDistributed data processing
AI Insights
Czym naprawdę jest ta rola?Data Engineer

Rola Data Engineera pracującego na infrastrukturze on-prem, odpowiedzialnego za projektowanie, budowę i utrzymanie skalowalnych pipeline'ów danych w środowisku hybrydowym (on-prem + chmura? choć ogłoszenie mówi 'hybrid environments' i 'on-prem data platforms'). Główny nacisk na technologie Kubernetes, Spark oraz Cloudera. Praca w małym, seniorskim zespole, zdalnie, dla klientów nordyckich. Rola obejmuje również udział w budowie produktów danych wspieranych AI.

Plusy
  • Kontrakt B2B z długim okresem (>12 miesięcy z przedłużeniami)
  • Mały, seniorski zespół – duża autonomia
  • Praca z nowoczesnym stackiem (Kubernetes, Spark, Airbyte) w środowisku on-prem
  • Szybki start (ASAP lub do miesiąca)
  • Elastyczna kultura pracy
Na co uważać
  • Weryfikacja referencji i sprawdzenie karalności po otrzymaniu oferty (może opóźnić start)
  • !Brak wzmianki o narzędziach CI/CD czy monitoringu (Prometheus, Grafana?)
  • !Nie sprecyzowano zakresu 'AI-driven data products' - czy to tylko buzzword?
  • !Proces rekrutacyjny: tylko 2 rozmowy, ale czy jest zadanie domowe?
  • !Brak informacji o wielkości zespołu (mimo że mały, ale ile osób?)
  • ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
Codzienna praca
  • Projektowanie i wdrażanie skalowalnych pipeline'ów danych na Kubernetes
  • Praca z rozproszonym przetwarzaniem danych (Spark) na klastrach on-prem
  • Konfiguracja i zarządzanie klastrami Cloudera (HDFS, Hive, etc.)
  • Tworzenie i utrzymanie kodów ETL/ELT w języku Python/Scala (zakładając, że Spark) w środowisku hybrydowym
  • Współpraca z zespołem przy optymalizacji wydajności zapytań i przepływów danych
  • Utrzymanie dokumentacji technicznej i architektury danych
  • Uczestnictwo w spotkaniach z klientami nordyckimi w języku angielskim
  • Debugowanie i rozwiązywanie problemów z infrastrukturą danych on-prem
Więcej o ofercie
Dla kogo jest ta oferta
Profil idealny

Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).

Minimum sensowne

Inżynier danych z co najmniej 2-3 latami praktyki z Kubernetes i Spark na on-prem, który jest w stanie samodzielnie utrzymać i rozwijać istniejące pipeline'y.

Raczej nie dla

Osoby bez doświadczenia z on-prem, skupione wyłącznie na chmurze (AWS/Azure/GCP). Juniorzy bez solidnej praktyki z wymaganymi technologiami.

Ocena dopasowania
Junior1/5
Mid4/5
Senior4/5
Hands-on5/5
Architekt2/5
Remote5/5
Enterprise3/5
Pytania do rekrutera
  • ?Ile osób liczy zespół i jakie są role pozostałych członków?
  • ?Czy praca jest w pełni zdalna, czy są spotkania on-site (np. raz na kwartał)?
  • ?Jakie jest konkretne środowisko on-prem – jaka wersja Cloudera, ile węzłów?
  • ?Czy istnieje możliwość przejścia na chmurę w przyszłości?
  • ?Czy są dyżury on-call i jak wygląda rotacja?
  • ?Jakie narzędzia CI/CD są używane?
  • ?Czy w projekcie używany jest też Kafka lub inne systemy streamingowe?
  • ?Jakie języki programowania będą używane – tylko Python/Scala czy też Java?
Brakujące informacje
  • Nie podano widełek wynagrodzenia
  • Brak informacji o budżecie szkoleniowym
  • Nie wiadomo, czy istnieje możliwość pracy na własnym sprzęcie
  • Brak szczegółów dotyczących 'AI-driven data products' – konkretne technologie ML?
  • Nie podano, jak często są spotkania zespołowe (daily, weekly?)
Zespół

Mały, zdalny zespół o elastycznej kulturze pracy, oferujący autonomię i odpowiedzialność. Praca głównie samodzielna, ale w ścisłej współpracy z innymi seniorami.

Rekrutacja

2 rozmowy z klientem (prawdopodobnie techniczna i biznesowa). Po złożeniu oferty przeprowadzana jest weryfikacja referencji i sprawdzenie karalności.

🔗Podobne oferty