AI/ML Data Engineer
Yard Corporate
To rola Data Engineera z silnym naciskiem na AI/ML w sektorze finansowym. Będziesz projektować i wdrażać narzędzia AI/ML do przetwarzania alternatywnych danych finansowych (clickstream, geolokalizacja, dane kart kredytowych) w celu generowania sygnałów inwestycyjnych. Na co dzień będziesz budować wydajne pipeline'y danych w Snowflake i dbt, integrować je z AWS oraz tworzyć agentów AI z użyciem LangChain i LlamaIndex. Rola łączy klasyczne data engineering z zastosowaniem LLM-ów, a efekty Twojej pracy będą bezpośrednio wpływać na decyzje inwestycyjne globalnego funduszu.
Brakuje: nie podano wielkości zespołu ani struktury raportowania, brak informacji o konkretnych narzędziach llm w produkcji.
To rola Data Engineera z silnym naciskiem na AI/ML w sektorze finansowym. Będziesz projektować i wdrażać narzędzia AI/ML do przetwarzania alternatywnych danych finansowych (clickstream, geolokalizacja, dane kart kredytowych) w celu generowania sygnałów inwestycyjnych. Na co dzień będziesz budować wydajne pipeline'y danych w Snowflake i dbt, integrować je z AWS oraz tworzyć agentów AI z użyciem LangChain i LlamaIndex. Rola łączy klasyczne data engineering z zastosowaniem LLM-ów, a efekty Twojej pracy będą bezpośrednio wpływać na decyzje inwestycyjne globalnego funduszu.
- ✓Bezpośredni wpływ na decyzje inwestycyjne globalnego funduszu
- ✓Praca z doświadczonymi kwantami i ekspertami dziedzinowymi
- ✓Nowoczesny stack technologiczny (Snowflake, dbt, AWS, LLM)
- ✓Kreatywne i eksploracyjne środowisko pracy
- ✓Możliwość budowania narzędzi AI od podstaw
- !Hybrydowy model pracy wymaga 3 dni w biurze w Warszawie – może być problemem dla osób spoza miasta
- !Ciągła presja na śledzenie najnowszych technologii LLM może prowadzić do przeciążenia informacyjnego
- !Brak informacji o budżecie na szkolenia lub konferencje
- !Rola łączy data engineering z AI, co może wymagać szerokiego zakresu umiejętności
- •Projektowanie i wdrażanie narzędzi AI/ML do ekstrakcji metadanych i generowania danych syntetycznych
- •Budowanie skalowalnych pipeline'ów danych w dbt i Snowflake do integracji alternatywnych zbiorów danych
- •Tworzenie agentów AI z użyciem LangChain/LlamaIndex, które udostępniają dane zespołom badawczym
- •Automatyzacja procesów produkcyjnych z wykorzystaniem AI w celu zwiększenia wydajności data engineeringu
- •Optymalizacja wydajności magazynu danych i udoskonalanie algorytmów
- •Współpraca z kwantami i ekspertami dziedzinowymi w celu zrozumienia wymagań danych
- •Pisanie kodu w Pythonie do transformacji danych i tworzenia API
- •Śledzenie najnowszych technologii LLM i integracja ich z istniejącymi narzędziami
Oferta skierowana do developerów z doświadczeniem komercyjnym (Mid).
Data Engineer z co najmniej 3 latami doświadczenia, solidnym Pythonem i SQL, podstawami chmury (AWS) i chęcią nauki LLM-ów. Musi dobrze działać w zespole i radzić sobie z szybko zmieniającymi się wymaganiami.
Juniorzy bez udokumentowanego doświadczenia w data engineeringu, osoby nieinteresujące się AI/ML lub preferujące pracę w pełni zdalną, a także kandydaci szukający stabilnej, powtarzalnej pracy bez kontaktu z najnowszymi technologiami.
- ?Ile osób liczy zespół Data Science & AI i jaka jest struktura (data engineerowie, data scientist, quants)?
- ?Które konkretnie biblioteki LLM są obecnie używane w produkcji?
- ?Czy istnieje już platforma danych, czy budujemy od zera?
- ?Ile typowych źródeł danych jest integrowanych w jednym pipeline?
- ?Czy są dyżury on-call lub wsparcie produkcyjne dla pipeline'ów?
- ?Jaki jest proces wdrażania zmian (CI/CD) i czy jest automatyzacja?
- ?Jaka jest proporcja czasu poświęconego na rozwój narzędzi AI/ML w porównaniu do standardowego data engineringu?
- ?Czy istnieje budżet na eksperymenty z nowymi technologiami?
- −Nie podano wielkości zespołu ani struktury raportowania
- −Brak informacji o konkretnych narzędziach LLM w produkcji
- −Nie wiadomo, czy istnieje budżet na szkolenia lub konferencje
- −Brak opisu ścieżki kariery w firmie
- −Nie określono procesu rekrutacyjnego (liczba etapów, zadanie domowe itp.)
- −Brak informacji o systemie kontroli wersji i CI/CD
Kreatywne i eksploracyjne środowisko, w którym współpracuje się z najlepszymi kwantami i ekspertami dziedzinowymi w atmosferze innowacji.
Powyżej mediany rynkowej
Dane z aktywnych ofert zawierających technologię Python. Pełne statystyki zarobków →