Data Curation and Automation Engineer
Svitla Systems
Rola łączy ręczną adnotację danych (obrazy, wideo, tekst) z automatyzacją w Pythonie. Będziesz odpowiadać za cały cykl życia danych – od tworzenia skryptów do czyszczenia i przetwarzania, po manualne adnotacje i kontrole jakości. Mimo tytułu 'Automation Engineer', głównym zadaniem jest adnotacja danych, a automatyzacja ma ją wspierać. Klient to firma produkująca rozwiązania do znakowania i druku.
Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji.
Brakuje: liczba osób w zespole i struktura, narzędzia do adnotacji.
To przede wszystkim rola adnotatora danych z elementami automatyzacji. W przeciwieństwie do typowego Data Engineera, większość czasu spędzisz na ręcznej adnotacji i kontroli jakości, a Python służy do automatyzacji powtarzalnych zadań, a nie do budowania rozbudowanych pipeline'ów.
Rola łączy ręczną adnotację danych (obrazy, wideo, tekst) z automatyzacją w Pythonie. Będziesz odpowiadać za cały cykl życia danych – od tworzenia skryptów do czyszczenia i przetwarzania, po manualne adnotacje i kontrole jakości. Mimo tytułu 'Automation Engineer', głównym zadaniem jest adnotacja danych, a automatyzacja ma ją wspierać. Klient to firma produkująca rozwiązania do znakowania i druku.
- ✓Projekty US i EU
- ✓Bonusy za artykuły i wystąpienia
- ✓Bezpłatne webinary i meetupy
- ✓Społeczność firmowa
- −Rola jest outsourcingowa (Svitla) – możliwy brak stabilności projektowej
- −Połączenie manualnej adnotacji z automatyzacją może być niedopasowane do oczekiwań inżyniera
- −Praca nad wieloma projektami jednocześnie może prowadzić do przeciążenia
- !Tytuł sugeruje bardziej inżynierską rolę niż jest w rzeczywistości
- !Szybkie tempo i zmieniające się wymagania
- !Brak informacji o procesie rekrutacyjnym i zespole
- !Wymóg 'ownership mindset' – może oznaczać dużą odpowiedzialność bez wsparcia
- ?Brak jawnych widełek — wynagrodzenie do ustalenia podczas rekrutacji
- •Pisanie skryptów Python do czyszczenia, formatowania i przetwarzania danych
- •Parsowanie zagnieżdżonych formatów danych (JSON, XML)
- •Ręczne adnotowanie obrazów, wideo i tekstu z wysoką dokładnością
- •Przeprowadzanie kontroli jakości (QC) na zestawach danych
- •Tworzenie i optymalizacja wytycznych adnotacji
- •Automatyzacja powtarzalnych zadań poprzez skrypty i pipeline'y
- •Dokumentowanie zbiorów danych i przepływów pracy
- •Praca nad wieloma projektami jednocześnie w szybkim tempie
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Inżynier z 2-letnim doświadczeniem w Pythonie, umiejący parsować JSON/XML i gotowy do wykonywania ręcznej adnotacji danych.
Osoby szukające czysto inżynierskiej roli bez komponentu manualnej adnotacji, lub seniorzy oczekujący pracy architektonicznej. Rola nie jest odpowiednia dla kogoś, kto nie chce pracować z dużymi zbiorami danych w trybie ręcznym.
- ?Jaki jest procent czasu poświęcony na adnotację manualną vs automatyzację?
- ?Ile osób liczy zespół i jak jest zorganizowany?
- ?Jakie narzędzia są używane do adnotacji (np. Labelbox, własne)?
- ?Jak wygląda proces przydziału zadań i priorytetyzacji?
- ?Czy istnieje ścieżka rozwoju w stronę czystej automatyzacji/inżynierii danych?
- ?Czy oferowane jest wsparcie w nauce adnotacji lub narzędzi?
- −Liczba osób w zespole i struktura
- −Narzędzia do adnotacji
- −Proces rekrutacyjny
- −Zakres wynagrodzenia
- −Długość projektu i stabilność
- −Priorytety – czy większy nacisk na adnotację czy automatyzację