Senior Synthetic Data Engineer
Svitla Systems
Rola koncentruje się na generowaniu syntetycznych danych treningowych dla modeli widzenia komputerowego (multi-view computer vision) przy użyciu Unreal Engine oraz generatywnej AI (dyfuzja, ComfyUI). Inżynier będzie projektować i ulepszać pipeline'y danych, skalować zbiory, wspierać zbieranie danych rzeczywistych i wspomagać inżynierów ML w poprawie jakości. To nie jest klasyczny Data Engineer od ETL, ale specjalista ds. danych dla AI z mocnym naciskiem na syntezę i augmentację.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: brak informacji o wynagrodzeniu, nie podano wielkości zespołu ani liczby inżynierów ml.
Rola koncentruje się na generowaniu syntetycznych danych treningowych dla modeli widzenia komputerowego (multi-view computer vision) przy użyciu Unreal Engine oraz generatywnej AI (dyfuzja, ComfyUI). Inżynier będzie projektować i ulepszać pipeline'y danych, skalować zbiory, wspierać zbieranie danych rzeczywistych i wspomagać inżynierów ML w poprawie jakości. To nie jest klasyczny Data Engineer od ETL, ale specjalista ds. danych dla AI z mocnym naciskiem na syntezę i augmentację.
- ✓Kontrakt B2B
- ✓Ciekawy, nowoczesny stack (Unreal Engine, diffusion models)
- ✓Elastyczność i bonusy za artykuły/wystąpienia
- ✓Programy nauki i rozwój
- −Wymóg nakładania się czasu pracy do 18-19 CET może oznaczać późne godziny dla osób z Europy środkowo-wschodniej
- !Brak widełek wynagrodzenia w ogłoszeniu
- !Firma outsourcingowa (Svitla Systems) - możliwy brak bezpośredniego wpływu na projekt
- !Opis 'projektowanie w niejasnym środowisku' może sugerować chaos organizacyjny
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Projektowanie i ulepszanie pipeline'ów do pozyskiwania i przetwarzania danych
- •Generowanie syntetycznych scen 3D w Unreal Engine do trenowania modeli CV
- •Stosowanie generatywnej AI (diffusion models, ComfyUI) do augmentacji istniejących zbiorów
- •Współpraca z inżynierami ML w celu poprawy pokrycia i jakości datasetów
- •Optymalizacja workflow'ów zbierania danych z rzeczywistych środowisk (sale konferencyjne)
- •Skalowanie produkcji danych, automatyzacja i redukcja ręcznego wysiłku
- •Projektowanie rozwiązań w nieostrym, ewoluującym środowisku
Oferta dla doświadczonych specjalistów (Senior).
Inżynier danych z co najmniej 2-3 latami doświadczenia w CV i generowaniu syntetycznym, spełniający wszystkie wymagania must-have, ale bez udokumentowanego senior levelu. Osoba gotowa do samodzielnej pracy przy pipeline'ach danych i generowaniu scen 3D.
Juniorzy ani osoby bez doświadczenia w Unreal Engine i generatywnej AI. Kandydaci szukający klasycznej roli Data Engineera (SQL, ETL, Big Data) lub preferujący pracę w ściśle określonych ramach.
- ?Jak liczny jest zespół, z którym przyjdzie współpracować?
- ?Jakie konkretnie modele dyfuzyjne lub narzędzia ComfyUI są używane?
- ?Czy istnieje już infrastruktura do renderowania w Unreal Engine, czy trzeba ją zbudować od zera?
- ?Jaki jest zakres nakładania czasowego? Czy codziennie do 18-19 CET?
- ?Czy przewidziane są dyżury lub praca w weekendy przy większych generacjach danych?
- ?Jakie są dalsze plany rozwoju projektu po wdrożeniu obecnej strategii danych?
- −Brak informacji o wynagrodzeniu
- −Nie podano wielkości zespołu ani liczby inżynierów ML
- −Brak opisu procesu rekrutacyjnego
- −Nie wiadomo, czy wymagana jest znajomość konkretnych wersji Unreal Engine
Zespół pracuje nad trzema filarami strategii danych – rzeczywista, syntetyczna i generatywna – w ścisłej współpracy z inżynierami ML. Środowisko jest dynamiczne, z naciskiem na skalowanie i automatyzację.