Senior Document Processing Engineer
Medius
Rola koncentruje się na rozwoju i ewolucji silnika do automatycznego przetwarzania dokumentów (głównie faktur) – od OCR, przez ekstrakcję danych, po strukturyzację. Łączy klasyczne algorytmy z nowoczesnymi technikami ML/LLM. Praca w zespole Capture, który buduje rdzeń platformy do automatyzacji procesów finansowych. Stack: Python (prototypy), C#/.NET (produkcja), Azure. Nie jest to rola czysto ML-owa – wymaga silnego backendu i domeny document processing.
Brakuje: nie podano liczby dni w biurze przy hybrydzie, nie opisano procesu rekrutacyjnego.
Rola koncentruje się na rozwoju i ewolucji silnika do automatycznego przetwarzania dokumentów (głównie faktur) – od OCR, przez ekstrakcję danych, po strukturyzację. Łączy klasyczne algorytmy z nowoczesnymi technikami ML/LLM. Praca w zespole Capture, który buduje rdzeń platformy do automatyzacji procesów finansowych. Stack: Python (prototypy), C#/.NET (produkcja), Azure. Nie jest to rola czysto ML-owa – wymaga silnego backendu i domeny document processing.
- ✓Praca na kluczowym, AI-powered produkcie
- ✓Nowoczesny stack (Azure, LLM, OCR)
- ✓Międzynarodowe środowisko zespołów w Szwecji, Polsce i Tunezji
- !Brak informacji o wielkości zespołu
- !Nie opisano procesu rekrutacyjnego
- !Wspomniano o współpracy z zespołami w trzech krajach – możliwe wyzwania komunikacyjne i czasowe
- •Projektowanie i implementacja pipeline'u przetwarzania dokumentów (OCR -> ekstrakcja -> dane strukturalne)
- •Pisanie kodu produkcyjnego w C#/.NET na platformie Azure
- •Prototypowanie nowych rozwiązań w Pythonie
- •Integracja nowych technologii OCR, LLM i metod ekstrakcji informacji
- •Tworzenie i utrzymywanie zestawów testowych do benchmarkowania wydajności ekstrakcji
- •Współpraca z zespołami ML i inżynieryjnymi w Szwecji, Polsce i Tunezji
- •Projektowanie rozwiązań łączących metody klasyczne z modelami uczenia maszynowego
- •Przegląd i optymalizacja istniejącego silnika ekstrakcji danych
Oferta dla doświadczonych specjalistów (Senior).
Inżynier z minimum 3-4 latami doświadczenia w backendzie (C#, Python) i przynajmniej podstawową znajomością OCR lub ekstrakcji informacji, gotowy do intensywnego rozwoju w domenie document processing.
Juniorzy bez doświadczenia w przetwarzaniu dokumentów ani silnych podstaw CS. Osoby szukające wyłącznie pracy zdalnej (rola hybrydowa w Krakowie). Kandydaci unikający .NET lub cloud-native developmentu.
- ?Ile osób liczy zespół Capture i jakie są role w zespole?
- ?Jak wygląda współpraca z zespołami w Szwecji i Tunezji – są wspólne sprinty, codzienne standupy?
- ?Czy istnieje oddzielny zespół MLOps, czy my odpowiadamy też za deployment modeli?
- ?Jaki jest stosunek pracy nad nowymi rozwiązaniami do utrzymania istniejącego silnika?
- ?Czy w ogłoszeniu chodzi o rozwijanie istniejącego systemu, czy budowę nowego od zera?
- ?Jakie LLM-y są obecnie używane lub rozważane?
- ?Czy istnieje możliwość pracy zdalnej w ramach hybrydy (ile dni w biurze)?
- ?Jakie są największe wyzwania techniczne stojące przed zespołem w najbliższych miesiącach?
- −Nie podano liczby dni w biurze przy hybrydzie
- −Nie opisano procesu rekrutacyjnego
- −Nie wiadomo, czy praca nad pipeline'em to głównie rozwijanie istniejącego kodu, czy nowe projekty
Międzynarodowy zespół (Szwecja, Polska, Tunezja) z kulturą opartą na wolności, ciekawości i ciągłym doskonaleniu. Firma organizuje integracje i wydarzenia, co sugeruje otwartą atmosferę.
Poniżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →