Budowa środowisk do trenowania i ewaluacji agentów AI (Reinforcement Learning). Projekt skupia się na tworzeniu systemów weryfikacji, automatycznym punktowaniu trajektorii i orkiestracji modeli.
⚠️ Red Flags
−wymagana praca w godzinach 14:00-22:00 (strefa czasowa klienta)
✅ Green Flags
✓praca nad innowacyjnym wyzwaniem technicznym (AGI/RL)
🎯 Środowisko
"Nastawienie na współpracę z inżynierami i badaczami AI w środowisku wysokiej specjalizacji."