Search suggestions:

praca zdalna
praca
praca od zaraz
hr
marketing
praca biurowa
english
urząd pracy
dam pracę
operator wózka widłowego
od 16 lat
od zaraz
księgowa
powiat lubelski
województwo śląskie
województwo dolnośląskie
Wrocław
województwo mazowieckie
Warsaw
województwo pomorskie
powiat zgierski
Łódź
województwo łódzkie
Lublin
powiat pabianicki

Data Enigneer

Air-Com Pneumatyka-Automatyka
Wrocław, województwo dolnośląskie
1 dzień temu

Wierzymy, że doświadczenie i pasja są podstawą sukcesu. Doceniają to nasi klienci, partnerzy i pracownicy. To właśnie sprawiło, że w ciągu 20 lat staliśmy się wiodącym dystrybutorem elementów i komponentów pneumatyki siłowej.


Dołączając do naszego zespołu będziesz mieć okazję pracować przy projekcie hurtowni danych w dużej skali i realnie wpływać na architekturę oraz dobór narzędzi. Cenimy swobodę technologiczną, a przy tym stawiamy na efektywność i jakość.


Jeśli podzielasz naszą filozofię i chcesz rozwijać się w ambitnych projektach data, zachęcamy do aplikowania.


Twoje zadania:

Będziesz je realizował po etapie wdrożenia.

  • Projektowanie i implementacja procesów ETL/ELT na danych produktowych i operacyjnych z różnych źródeł (ERP, API, scraping).

  • Budowa i rozwój hurtowni danych opartej na PostgreSQL oraz rozszerzanie architektury o narzędzia big data (np. Spark, Dask).

  • Modelowanie danych i projektowanie procesów z myślą o dużej skali (miliony rekordów).

  • Harmonogramowanie i automatyzacja procesów przy użyciu orkiestratorów (Airflow, Prefect, Luigi).

  • Integracja danych z systemem Subiekt oraz innymi źródłami (REST API, SOAP, XML/CSV).

  • Scraping i masowe pozyskiwanie danych z wielu źródeł zewnętrznych z uwzględnieniem anti-bot detection, proxy, kolejkowania.

  • Przygotowanie i wzbogacanie danych pod kątem zastosowań AI i NLP (czyszczenie tekstu, tokenizacja, embeddingi, wektorowe bazy danych).
    Współpraca z zespołem data w zakresie dostarczania danych i wspierania projektów AI/ML.

  • Optymalizacja zapytań SQL i procesów ETL (partycjonowanie, indeksowanie, sharding, materializowane widoki).

  • Wdrożenie monitoringu i kontroli jakości danych (Great Expectations, dbt tests, Soda).

  • Dokumentowanie architektury danych i procesów.

  • Mile widziane doświadczenie z narzędziami BI (Metabase, Tableau, Power BI) oraz w pracy z danymi tekstowymi i NLP (spaCy, HuggingFace).

  • Mile widziana znajomość Pythona (integracje API, NLP, data wrangling), hurtowni w chmurze (BigQuery, Redshift, Snowflake), narzędzi integracyjnych (Airbyte, Fivetran, Singer) oraz zasad DataOps ((testy danych, versioning datasetów, CI/CD dla ETL).

Nasze oczekiwania:

Możesz pracować w rozwijającej się firmie, jeśli ten profil pasuje do Ciebie


  • Bardzo dobra znajomość SQL (PostgreSQL, T-SQL).

  • Doświadczenie w projektowaniu i utrzymywaniu procesów ETL/ELT.

  • Praktyczne doświadczenie w pracy z PostgreSQL jako hurtownią danych.

  • Znajomość i doświadczenie z dbt (Data Build Tool).

  • Umiejętność pracy z danymi przyrostowymi i modelami incremental.

  • Doświadczenie z Apache Airflow lub innym orkiestratorem ETL.

  • Doświadczenie w pracy z GIT i repozytoriami kodu (CI/CD).

  • Doświadczenie w przetwarzaniu danych pod kątem AI, NLP, embeddingów i wektorowych baz danych (pgvector, Pinecone, FAISS).

  • Znajomość struktury danych systemów ERP.

  • Doświadczenie w scrapingu i masowym pobieraniu danych (Scrapy, Playwright, Selenium, API).

  • Umiejętność pracy z narzędziami do przetwarzania dużych zbiorów danych (Spark, Dask, PySpark, Hadoop).

  • Znajomość konteneryzacji i orkiestracji (Docker, Kubernetes).

  • Praktyka w zakresie monitoringu danych i pipeline’ów (Prometheus, Grafana, logging/alerting).

  • Samodzielność i odpowiedzialność za procesy danych end-to-end.

  • Umiejętność dokumentowania pipeline’ów danych i modeli.

Nasza propozycja:

To tylko kilka najważniejszych informacji. Inne będą miłą niespodzianką.


  • ciekawa praca w firmie o ugruntowanej pozycji

  • udział w budowaniu rozwijającej się marki cieszącej się uznaniem klientów

  • możliwość rozwoju, zdobycia doświadczenia oraz szerokiej wiedzy

  • duża samodzielność, otwartość na kreatywne pomysły

  • konkurencyjne wynagrodzenie, adekwatne do doświadczenia

  • stabilne zatrudnienie w oparciu o umowę o pracę, niezbędne narzędzia

  • przyjazna atmosfera pracy w zespole pasjonatów

Apply
Save
Report job
Other Job Recommendations:

Vendor Data Lifecycle Analyst

Philip Morris International
powiat lubelski, województwo lubelskie
  • Knowledge of SAP and Vendor Master Data maintenance would...
  • Ability to build relationships and work collaboratively...
4 dni temu

Internship in Legal Data Protection and Contracting Team

Boehringer Ingelheim
Wrocław, województwo dolnośląskie
  • Review and negotiating the Non Disclosure Agreements
  • Analysis, review, negotiating and administrative support...
3 tygodnie temu

Data Scientist - Freelancer

Monterail
Warsaw, województwo mazowieckie
We are looking for a Data Scientist to join our team and support us in designing robust data models and advanced statistical...
3 tygodnie temu

Reference Data Services Analyst

Citi
Olsztyn, województwo warmińsko-mazurskie
  • Provide a high level of customer service to our internal...
  • Working on shift: Shift based schedule, 8 hour shifts,...
4 tygodnie temu

Data Engineer

Joyteractive
Warsaw, województwo mazowieckie
  • Configuration of incremental data extraction and...
  • Creating and maintaining SQL models (from staging to...
3 tygodnie temu

Senior/Staff Scientist, Cheminformatics & Data Science

Deep Origin
Ruda Śląska, województwo śląskie
  • Deep familiarity with protein-ligand interactions, protein...
  • Experience working with DNA-encoded libraries datasets,...
3 tygodnie temu

Reference Data Management Analyst

Citi
Olsztyn, województwo warmińsko-mazurskie
Requires a good knowledge of the range of processes, procedures and systems to be used in carrying out assigned tasks and a basic...
3 tygodnie temu

Solutions Analyst

LexisNexis Legal & Professional
Wrocław, województwo dolnośląskie
We enable innovators to accomplish more by helping them make informed decisions, be more productive, comply with regulations and...
1 dzień temu

Sprzedawca - Kasjer Biedronka I Dąbrowa Górnicza I Gołonóg

Biedronka
Dąbrowa Górnicza, województwo śląskie
  • Dbanie o porządek w sklepie oraz w jego obrębie.
  • Lubisz kontakt z ludźmi i pracę w zespole;...
1 dzień temu

Specjalistka/-ta ds. Rejestracji Leków i Bezpieczeństwa Farmakoterapii

Recordati S.p.A
Warsaw, województwo mazowieckie
  • Przestrzeganiem strategii realizacji procedur rejestracji...
  • Przygotowywaniem oraz terminowym prowadzeniem procesów...
1 dzień temu