Senior Databricks & GenAI Engineer
IN4GE
Rola łączy Data Engineering z wdrażaniem AI/ML, ale rdzeniem jest budowa i optymalizacja pipeline'ów danych na Databricks/Spark, z deploymentem modeli. GenAI to buzzword – realnie chodzi o automatyzację procesów danych i ML. Praca w modelu 100% zdalnym dla klienta zewnętrznego (firma rekrutacyjna IN4GE).
Brakuje: nie podano konkretnego klienta (firmy, sektora), brak informacji o wielkości zespołu i jego składzie.
Rola łączy Data Engineering z wdrażaniem AI/ML, ale rdzeniem jest budowa i optymalizacja pipeline'ów danych na Databricks/Spark, z deploymentem modeli. GenAI to buzzword – realnie chodzi o automatyzację procesów danych i ML. Praca w modelu 100% zdalnym dla klienta zewnętrznego (firma rekrutacyjna IN4GE).
- ✓100% zdalna praca w modelu B2B z elastycznym czasem
- ✓Transparentny proces rekrutacyjny (3 etapy: screening, rozmowa, techniczna)
- ✓Możliwość realnego wpływu na architekturę i rozwój platform danych
- −Rekrutacja przez agencję – brak informacji o konkretnym kliencie (firmie docelowej)
- −Nie wiadomo, czy projekt to greenfield czy legacy – ryzyko pracy z brudnymi danymi
- !Buzzword 'GenAI' w tytule – rola to głównie Data Engineering z elementami AI
- !Wymagania dość ogólne ('ekosystem open-source') – możliwe niedoprecyzowanie stacku
- !Brak info o wielkości zespołu i strukturze klienta
- •Projektowanie i budowa pipeline'ów danych ETL/ELT w środowisku Databricks
- •Optymalizacja wydajności workflow danych z użyciem Apache Spark
- •Wdrażanie rozwiązań AI/ML i pipeline'ów deploymentowych modeli
- •Integracja platform danych z narzędziami AI i systemami zespołów projektowych
- •Udział w decyzjach architektonicznych i definiowanie dobrych praktyk Data Engineering
- •Realizacja procesów end-to-end od ingestii danych po deployment modeli
- •Współpraca z zespołami developerskimi, cloudowymi i biznesowymi
Oferta dla doświadczonych specjalistów (Senior).
Mid Data Engineer z solidnym Databricks/Spark, znający podstawy AI/ML deploymentu, gotowy do rozwoju w kierunku GenAI.
Osoby bez komercyjnego doświadczenia z Databricks i Spark (juniorzy, mid bez praktyki w tych narzędziach). Nie dla kandydatów szukających wyłącznie backendu lub czystego ML.
- ?Jaki jest sektor i skala klienta (startup, enterprise)?
- ?Czy Databricks to jedyne środowisko, czy też inne narzędzia (Delta Lake, MLflow)?
- ?Jakie konkretnie narzędzia AI/ML są używane (np. MLflow, TensorFlow, PyTorch)?
- ?Jak wygląda proces deploymentu modeli – kto odpowiada za CI/CD?
- ?Czy są dyżury on-call? Jeśli tak, jak często?
- ?Ile osób liczy zespół i jaka jest jego struktura (Data Engineers, Data Scientists, DevOps)?
- ?Czy projekt jest nowy (greenfield) czy rozwijany z istniejącego legacy?
- ?Jakie są główne wyzwania techniczne w obecnym projekcie?
- −Nie podano konkretnego klienta (firmy, sektora)
- −Brak informacji o wielkości zespołu i jego składzie
- −Nie wiadomo, czy projekt jest nowy czy rozwijany z istniejącego legacy
- −Brak opisu procesu CI/CD i narzędzi MLOps
Wstępna weryfikacja telefoniczna -> Rozmowa rekrutacyjna -> Rozmowa techniczna
Poniżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Databricks. Pełne statystyki zarobków →