Data Engineer (on prem)
emagine
Rola Data Engineera pracującego na infrastrukturze on-prem, odpowiedzialnego za projektowanie, budowę i utrzymanie skalowalnych pipeline'ów danych w środowisku hybrydowym (on-prem + chmura? choć ogłoszenie mówi 'hybrid environments' i 'on-prem data platforms'). Główny nacisk na technologie Kubernetes, Spark oraz Cloudera. Praca w małym, seniorskim zespole, zdalnie, dla klientów nordyckich. Rola obejmuje również udział w budowie produktów danych wspieranych AI.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: nie podano widełek wynagrodzenia, brak informacji o budżecie szkoleniowym.
Rola Data Engineera pracującego na infrastrukturze on-prem, odpowiedzialnego za projektowanie, budowę i utrzymanie skalowalnych pipeline'ów danych w środowisku hybrydowym (on-prem + chmura? choć ogłoszenie mówi 'hybrid environments' i 'on-prem data platforms'). Główny nacisk na technologie Kubernetes, Spark oraz Cloudera. Praca w małym, seniorskim zespole, zdalnie, dla klientów nordyckich. Rola obejmuje również udział w budowie produktów danych wspieranych AI.
- ✓Kontrakt B2B z długim okresem (>12 miesięcy z przedłużeniami)
- ✓Mały, seniorski zespół – duża autonomia
- ✓Praca z nowoczesnym stackiem (Kubernetes, Spark, Airbyte) w środowisku on-prem
- ✓Szybki start (ASAP lub do miesiąca)
- ✓Elastyczna kultura pracy
- −Weryfikacja referencji i sprawdzenie karalności po otrzymaniu oferty (może opóźnić start)
- !Brak wzmianki o narzędziach CI/CD czy monitoringu (Prometheus, Grafana?)
- !Nie sprecyzowano zakresu 'AI-driven data products' - czy to tylko buzzword?
- !Proces rekrutacyjny: tylko 2 rozmowy, ale czy jest zadanie domowe?
- !Brak informacji o wielkości zespołu (mimo że mały, ale ile osób?)
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie i wdrażanie skalowalnych pipeline'ów danych na Kubernetes
- •Praca z rozproszonym przetwarzaniem danych (Spark) na klastrach on-prem
- •Konfiguracja i zarządzanie klastrami Cloudera (HDFS, Hive, etc.)
- •Tworzenie i utrzymanie kodów ETL/ELT w języku Python/Scala (zakładając, że Spark) w środowisku hybrydowym
- •Współpraca z zespołem przy optymalizacji wydajności zapytań i przepływów danych
- •Utrzymanie dokumentacji technicznej i architektury danych
- •Uczestnictwo w spotkaniach z klientami nordyckimi w języku angielskim
- •Debugowanie i rozwiązywanie problemów z infrastrukturą danych on-prem
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Inżynier danych z co najmniej 2-3 latami praktyki z Kubernetes i Spark na on-prem, który jest w stanie samodzielnie utrzymać i rozwijać istniejące pipeline'y.
Osoby bez doświadczenia z on-prem, skupione wyłącznie na chmurze (AWS/Azure/GCP). Juniorzy bez solidnej praktyki z wymaganymi technologiami.
- ?Ile osób liczy zespół i jakie są role pozostałych członków?
- ?Czy praca jest w pełni zdalna, czy są spotkania on-site (np. raz na kwartał)?
- ?Jakie jest konkretne środowisko on-prem – jaka wersja Cloudera, ile węzłów?
- ?Czy istnieje możliwość przejścia na chmurę w przyszłości?
- ?Czy są dyżury on-call i jak wygląda rotacja?
- ?Jakie narzędzia CI/CD są używane?
- ?Czy w projekcie używany jest też Kafka lub inne systemy streamingowe?
- ?Jakie języki programowania będą używane – tylko Python/Scala czy też Java?
- −Nie podano widełek wynagrodzenia
- −Brak informacji o budżecie szkoleniowym
- −Nie wiadomo, czy istnieje możliwość pracy na własnym sprzęcie
- −Brak szczegółów dotyczących 'AI-driven data products' – konkretne technologie ML?
- −Nie podano, jak często są spotkania zespołowe (daily, weekly?)
Mały, zdalny zespół o elastycznej kulturze pracy, oferujący autonomię i odpowiedzialność. Praca głównie samodzielna, ale w ścisłej współpracy z innymi seniorami.
2 rozmowy z klientem (prawdopodobnie techniczna i biznesowa). Po złożeniu oferty przeprowadzana jest weryfikacja referencji i sprawdzenie karalności.