Senior Data Engineer / Data Scientist
Tenarai
Rola łączy obowiązki Data Engineera i Data Scientista, koncentrując się na masterowaniu danych i rozpoznawaniu encji (Entity Resolution) dla platformy korporacyjnej. Na co dzień będziesz projektować i optymalizować frameworki dopasowywania danych, wykorzystując techniki ML/NLP oraz embeddingi. Budować będziesz skalowalne pipeline'y danych, implementować algorytmy dopasowywania, standaryzacji i deduplikacji oraz tworzyć złote rekordy. Wymagana jest głęboka wiedza w obszarze jakości danych i zarządzania danymi, a także umiejętność wdrażania modeli ML do produkcji.
Brakuje: nie podano nazwy klienta końcowego., brak informacji o wielkości zespołu i strukturze..
Rola łączy obowiązki Data Engineera i Data Scientista, koncentrując się na masterowaniu danych i rozpoznawaniu encji (Entity Resolution) dla platformy korporacyjnej. Na co dzień będziesz projektować i optymalizować frameworki dopasowywania danych, wykorzystując techniki ML/NLP oraz embeddingi. Budować będziesz skalowalne pipeline'y danych, implementować algorytmy dopasowywania, standaryzacji i deduplikacji oraz tworzyć złote rekordy. Wymagana jest głęboka wiedza w obszarze jakości danych i zarządzania danymi, a także umiejętność wdrażania modeli ML do produkcji.
- ✓Szczegółowy opis obowiązków i wymagań wskazuje na dojrzały zespół i jasne oczekiwania.
- ✓Budżet rozwojowy i platforma edukacyjna wspierają rozwój zawodowy.
- ✓Rola o strategicznym znaczeniu dla poprawy jakości danych w dużej organizacji.
- ✓Prywatna opieka medyczna w pakiecie Platinum oraz platforma MyBenefit.
- !Niejasność co do tego, czy rola jest bardziej Data Engineer czy Data Scientist – ogłoszenie łączy obie ścieżki.
- !Nie podano nazwy klienta końcowego – oferta pochodzi od agencji.
- !Wymagania są bardzo obszerne i mogą być trudne do spełnienia w całości.
- !Benefity opisane ogólnikowo (zależne od formy zatrudnienia).
- •Projektowanie i optymalizacja frameworków do masterowania danych oraz rozwiązań Entity Resolution.
- •Ulepszanie algorytmów dopasowywania (matching) i scalania danych przy użyciu ML/NLP i embeddingów.
- •Budowanie i rozwijanie pipeline'ów danych do przetwarzania dużych zbiorów danych (strukturyzowanych i niestrukturyzowanych).
- •Implementowanie procesów standaryzacji, normalizacji i deduplikacji danych oraz tworzenie złotych rekordów.
- •Trenowanie, ewaluacja i wdrażanie modeli ML do identyfikacji encji, klasteryzacji i scoringu podobieństwa.
- •Współpraca z zespołami produktowymi, inżynieryjnymi i architektonicznymi w celu definiowania wymagań i metryk sukcesu.
- •Monitorowanie i optymalizacja wydajności modeli (precision, recall, F1-score) oraz pipeline'ów produkcyjnych.
- •Utrzymanie jakości danych, linii danych i obserwowalności na platformie.
Oferta dla doświadczonych specjalistów (Senior).
Data Engineer lub Data Scientist z około 8-letnim doświadczeniem, solidną znajomością Entity Resolution i masterowania danych, dobrą znajomością Pythona i SQL oraz podstawami ML/NLP.
Nie dla osób z mniej niż 8 latami doświadczenia w Data Engineering/Data Science. Nie dla kandydatów bez konkretnego doświadczenia w masterowaniu danych, dopasowywaniu encji lub podobnych obszarach.
- ?Czy klient to firma produktowa czy konsultingowa?
- ?Jaka jest wielkość zespołu i z kim będę współpracować?
- ?Jakie konkretnie narzędzia/platformy są używane (np. Databricks, Spark, cloud)?
- ?Jak wygląda proces rekrutacyjny (etapy, czas)?
- ?Czy są dyżury on-call?
- ?Jaki jest stosunek pracy nad nowymi rozwiązaniami do utrzymania istniejących?
- ?Czy rola jest bardziej nachylona w stronę data engineering czy data science?
- −Nie podano nazwy klienta końcowego.
- −Brak informacji o wielkości zespołu i strukturze.
- −Nie określono konkretnych technologii (cloud, Spark itp. są tylko preferowane).
- −Nie opisano procesu rekrutacyjnego.
- −Nie wiadomo, czy są dyżury on-call.
- −Nie określono stosunku pracy nad nowymi funkcjonalnościami do utrzymania.
Na poziomie rynkowym
Dane z aktywnych ofert zawierających technologię Machine Learning. Pełne statystyki zarobków →