Data Engineer (Praca hybrydowa - Kraków)
IT TALENTO
Rola Data Engineera w projekcie dla klienta zewnętrznego. Odpowiadasz za projektowanie, rozwój i optymalizację skalowalnych pipeline'ów danych w środowisku rozproszonym, głównie z użyciem PySpark, Python i Azure Data Factory. Pracujesz nad przetwarzaniem dużych wolumenów danych, ETL/ELT, optymalizacją wydajności. Współpracujesz z Data Scientistami i architektami. Klient z branży Data Engineering.
Brakuje: nie podano wielkości zespołu, brak opisu procesu rekrutacyjnego.
Rola Data Engineera w projekcie dla klienta zewnętrznego. Odpowiadasz za projektowanie, rozwój i optymalizację skalowalnych pipeline'ów danych w środowisku rozproszonym, głównie z użyciem PySpark, Python i Azure Data Factory. Pracujesz nad przetwarzaniem dużych wolumenów danych, ETL/ELT, optymalizacją wydajności. Współpracujesz z Data Scientistami i architektami. Klient z branży Data Engineering.
- ✓Długoterminowy projekt – stabilność zatrudnienia
- ✓Jasno określony stack technologiczny (PySpark, Python, ADF)
- ✓Możliwość pracy z dużymi wolumenami danych i optymalizacją
- −Niespójność między trybem pracy: strukturalne dane wskazują 'office', opis wskazuje 'hybrydowo' – warto wyjaśnić na rozmowie
- −Firma rekrutująca (IT Talento) to mała agencja (1-9 pracowników wg danych strukturalnych), choć deklaruje grupę 1000 ekspertów – ryzyko bycia 'przekazanym' do klienta bez wsparcia
- −Brak informacji o beneficie poza wynagrodzeniem (B2B) – np. brak płatnego urlopu
- !Brak opisu procesu rekrutacyjnego
- !Nie podano wielkości zespołu ani struktury projektu
- !Brak informacji o dyżurach on-call
- !Wymagane 6 lat IT, ale nie wiadomo czy to sztywny bloker
- !Wynagrodzenie podane jako stawka godzinowa – może być mniej stabilne niż miesięczne
- •Projektowanie i rozwój pipeline'ów danych w PySpark i Python
- •Tworzenie i optymalizacja procesów ETL/ELT dla dużych wolumenów danych
- •Przetwarzanie danych strukturalnych i niestrukturalnych z wielu źródeł
- •Optymalizacja wydajności przetwarzania (partitioning, caching, join optimization)
- •Zarządzanie workflowami w Azure Data Factory
- •Współpraca z Data Scientistami, architektami i analitykami biznesowymi
- •Rozwiązywanie problemów wydajnościowych w środowisku distributed processing
- •Utrzymywanie jakości i spójności danych
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Data Engineer z co najmniej 4 latami doświadczenia w PySpark i Python, znający Azure Data Factory, gotowy do pracy w hybrydzie z Krakowa. Może mieć nieco mniejsze doświadczenie w optymalizacji wydajności, ale zna podstawy.
Nie dla juniorów ani osób z mniej niż 4 latami praktycznego doświadczenia w PySpark i Python. Rola wymaga samodzielności i głębokiej znajomości distributed data processing, więc osoby dopiero rozpoczynające karierę w Data Engineering nie będą odpowiednie.
- ?Ile osób liczy zespół Data Engineering po stronie klienta?
- ?Czy projekt jest greenfieldowy, czy rozwijacie istniejący system?
- ?Jakie są godziny pracy i czy przewidziane są dyżury?
- ?Czy są zapewnione szkolenia lub budżet na rozwój?
- ?Jak wygląda kwestia hybrid – opis mówi hybrydowo, ale dane wskazują stacjonarnie – ile dni w biurze?
- ?Kto jest klientem i w jakiej branży?
- ?Jaki jest proces rekrutacji – ile etapów, czy jest zadanie domowe?
- −Nie podano wielkości zespołu
- −Brak opisu procesu rekrutacyjnego
- −Nie wiadomo czy przewidziane są dyżury on-call
- −Brak informacji o beneficie na B2B (np. urlop, dni chorobowe)
- −Nie sprecyzowano dokładnego modelu hybrydowego (liczba dni w biurze)
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →