Data Engineer
Transition Technologies MS
Rola koncentruje się na budowie i utrzymaniu skalowalnych, niezawodnych potoków danych (batch i streaming) w chmurze GCP. Będziesz pracować z Apache Spark/Beam, Airflow, dbt i SQL, tworząc warstwy danych dla analityki i raportowania. Dodatkowo wymagane jest doświadczenie z narzędziami AI-assisted coding i AI-driven data workflows, co wyróżnia tę ofertę. To klasyczne stanowisko Data Engineera, ale z naciskiem na nowoczesne narzędzia i AI.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: brak informacji o widełkach wynagrodzenia, nie podano konkretnego systemu strumieniowego (pub/sub, kafka?) ani wersji.
Rola koncentruje się na budowie i utrzymaniu skalowalnych, niezawodnych potoków danych (batch i streaming) w chmurze GCP. Będziesz pracować z Apache Spark/Beam, Airflow, dbt i SQL, tworząc warstwy danych dla analityki i raportowania. Dodatkowo wymagane jest doświadczenie z narzędziami AI-assisted coding i AI-driven data workflows, co wyróżnia tę ofertę. To klasyczne stanowisko Data Engineera, ale z naciskiem na nowoczesne narzędzia i AI.
- ✓Nowoczesny stack danych: dbt, Airflow, Spark/Beam, GCP
- ✓Nie-korporacyjna atmosfera
- ✓Elastyczne godziny pracy
- !Wymagane jest 'obowiązkowe' doświadczenie z AI-assisted coding tools – może to być ograniczeniem dla osób niekorzystających z takich narzędzi
- !Opis wymienia bardzo szeroki zakres technologii (GCP, Spark, Beam, Flink, Airflow, dbt, streaming, AI workflows) – ryzyko, że rola wymaga znajomości zbyt wielu rzeczy naraz
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie i implementacja potoków danych batch i streaming w Apache Spark/Beam
- •Orkiestracja workflow w Apache Airflow
- •Tworzenie i utrzymanie transformacji danych w SQL i dbt
- •Zapewnienie jakości danych, obserwowalności i wydajności potoków
- •Współpraca z Analytics Engineerami i Platform Engineerami
- •Używanie narzędzi AI-assisted coding w codziennej pracy (np. GitHub Copilot, Claude Code)
- •Budowanie niezawodnych, dobrze modelowanych zbiorów danych w hurtowni danych
Oferta dla doświadczonych specjalistów (Senior).
Mid-level Data Engineer z minimum 3-4 latami praktyki w cloud (np. AWS/Azure) i solidnym doświadczeniem w Spark, Airflow, SQL i dbt. Wymagana jest znajomość AI-assisted coding tools.
Juniorzy ani osoby bez doświadczenia w cloud i przetwarzaniu rozproszonym. Rola wymaga samodzielności i szerokiej wiedzy technicznej, więc osoby poniżej 3 lat doświadczenia raczej nie spełnią wymagań.
- ?Ile osób liczy zespół Data Engineering?
- ?Jaki jest stosunek pracy nad potokami batch do streaming?
- ?Jakie konkretnie narzędzia AI-assisted coding są używane i czy firma zapewnia licencje?
- ?Czy w codziennej pracy korzystamy z gotowych frameworków ML/AI (np. Vertex AI) czy samodzielnie budujemy pipeline'y?
- ?Jaka hurtownia danych jest używana (BigQuery, Snowflake, inna)?
- ?Czy są dyżury on-call? Jak często?
- ?Jak wygląda proces developmentu i deploy'u potoków (CI/CD)?
- −Brak informacji o widełkach wynagrodzenia
- −Nie podano konkretnego systemu strumieniowego (Pub/Sub, Kafka?) ani wersji
- −Brak opisu wielkości zespołu i struktury
- −Nie wiadomo, jaka jest konkretna hurtownia danych (BigQuery? Snowflake?)
- −Brak informacji o procesie rekrutacyjnym (liczba etapów, zadanie domowe, live coding)
Nie-korporacyjna atmosfera, elastyczne godziny pracy, możliwość pracy zdalnej lub hybrydowej.