Machine Learning Engineer - Energy Forecasting
ForecastPower
Rola polega na budowaniu i utrzymaniu produkcyjnych modeli prognostycznych dla danych energetycznych (ceny, generacja, zużycie). Praca obejmuje cały cykl życia modeli: od analizy danych, przez inżynierię cech, implementację modeli regresyjnych i boostingowych, walidację (backtesting, unikanie data leakage), po wdrożenie przez API i monitoring w środowisku produkcyjnym. Zespół liczy 5 osób (data scientist), pracujecie nad jednym projektem – nową usługą prognoz. Oczekiwana jest samodzielność i odpowiedzialność za proces prognostyczny, a także nacisk na stabilność i powtarzalność, a nie tylko POC.
Brakuje: nie podano informacji o dyżurach on-call, brak szczegółów dotyczących monitoringu modeli w produkcji (narzędzia, metryki).
Rola polega na budowaniu i utrzymaniu produkcyjnych modeli prognostycznych dla danych energetycznych (ceny, generacja, zużycie). Praca obejmuje cały cykl życia modeli: od analizy danych, przez inżynierię cech, implementację modeli regresyjnych i boostingowych, walidację (backtesting, unikanie data leakage), po wdrożenie przez API i monitoring w środowisku produkcyjnym. Zespół liczy 5 osób (data scientist), pracujecie nad jednym projektem – nową usługą prognoz. Oczekiwana jest samodzielność i odpowiedzialność za proces prognostyczny, a także nacisk na stabilność i powtarzalność, a nie tylko POC.
- ✓Realny wpływ na utworzenie nowej usługi (greenfield w ramach produktu)
- ✓Praca nad systemem produkcyjnym, a nie POC
- ✓Autonomia technologiczna opisana wprost
- ✓Bardzo krótki proces rekrutacyjny – jedna rozmowa techniczna (ok. 1 h)
- ✓Przestrzeń do eksperymentowania i wymiana wiedzy technicznej w firmie
- !Poziom 'regular' przy wymaganiu minimum 3 lat – może być traktowany jako mid, ale określenie 'regular' jest mało precyzyjne
- !Brak informacji o dyżurach on-call lub monitoringu po godzinach
- !Mały zespół (5 osób) może oznaczać ograniczone wsparcie ze strony DevOps/infrastruktury
- !Rola skupiona na jednym projekcie – może być ryzyko nudy w dłuższej perspektywie
- •Opracowywanie i ulepszanie modeli prognostycznych dla szeregów czasowych (ceny, generacja, zużycie energii)
- •Inżynieria cech: tworzenie opóźnień, statystyk kroczących, zmiennych sezonowych, kalendarzowych i pogodowych
- •Implementacja modeli regresyjnych (drzewa decyzyjne, boosting) z użyciem scikit-learn, XGBoost, LightGBM
- •Walidacja modeli poprzez backtesting i eliminacja przecieku informacji (data leakage)
- •Integracja modeli z ETL poprzez dedykowany pakiet Pythona (API)
- •Budowa pipeline'ów trenowania i okresowej aktualizacji modeli (retraining)
- •Monitorowanie jakości i stabilności modeli w środowisku produkcyjnym
- •Kodowanie w Pythonie z pandas, numpy, scikit-learn oraz praca z GitLab, Confluence, Slack
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Analityk danych z co najmniej 3 latami doświadczenia w ML, który ma solidne podstawy w szeregach czasowych i modelach regresyjnych, ale niekoniecznie zna branżę energetyczną. Potrafi samodzielnie prowadzić proces prognostyczny od danych do wdrożenia.
Osoby z mniej niż 3 latami doświadczenia w ML/data science, szczególnie jeśli nie pracowały z szeregami czasowymi. Również kandydaci szukający głównie deep learningu lub prac nad POC – rola skupia się na stabilnych, produkcyjnych modelach.
- ?Na jakim etapie jest rozwój nowej usługi prognostycznej – czy to greenfield, czy już istnieje MVP?
- ?Jaki jest skład zespołu oprócz data scientist? Czy jest osobna osoba do DevOps/infra?
- ?Jak wygląda monitoring modeli w produkcji? Czy są jakieś konkretne narzędzia (np. Grafana, Prometheus)?
- ?Czy są przewidziane dyżury on-call lub praca w weekendy przy awariach modeli?
- ?Jak często planowane jest retrenowanie modeli i co je wyzwala?
- ?Czy istnieje możliwość publikacji wyników lub udziału w konferencjach?
- ?Jaki jest budżet szkoleniowy lub dostęp do kursów/szkoleń?
- −Nie podano informacji o dyżurach on-call
- −Brak szczegółów dotyczących monitoringu modeli w produkcji (narzędzia, metryki)
- −Nie wiadomo czy istnieje osobny zespół DevOps/infrastruktury
- −Brak informacji o budżecie szkoleniowym lub konferencyjnym
Mały, autonomiczny zespół z przestrzenią do eksperymentowania i wymianą wiedzy. Oczekiwana samodzielność i odpowiedzialność za proces prognostyczny, nacisk na jakość i stabilność.
Jedna rozmowa techniczna (zdalna, ok. 1 godzina), po której następuje decyzja.
Powyżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →