ZERONE
Nazad na projekte
Data Engineering · Recruitment Intelligence · 2026

Case 01 — Job-Intelligence platforma

Distribuirani 7-server crawler, 16 ATS integracija, kontinuirano obogaćivanje za 2,5 M otvorenih pozicija na DACH tržištu.

2,5 MOglasa za posao
7Servera u klasteru
16ATS integracija
55+Aktivnih demona

Izazov

Lider na DACH tržištu regrutinga morao je da izgradi sloj podataka koji njegov interni tim više nije mogao da održi: milioni aktivnih pozicija, dnevno obnavljanih, iz 16 različitih ATS sistema, obogaćeni kontaktima, platnim rangovima, meta-podacima firmi i semantičkom analizom opisa. Bez prekida, bez rupa u podacima, sa forenzički sledljivom kontrolom kvaliteta.

Arhitektura

Master čvor orkestrira API, cron, daemon-keeper i frontend. Šest specijalizovanih worker-čvorova dele opterećenje po domenu — ATS crawling, ekstrakcija karijernih strana, description shards, geo-discovery. Posebna baza sa PgBouncer pool-om.

API · Cron · Orkestrator · FrontendMASTERORCHESTRATORATS Crawler · 13 Enricher demonaW1WORKERKarijerne strane · Triple Enricher · Contact CompleterW2WORKERCareer HTML · PDF ekstrakcija · Description shards 3–4W3WORKERPostgreSQL 15 Primary · PgBouncer poolDBPRIMARYDescription shards 5–7 · Residential proxy scraperW5WORKERGeo-Discovery · 25 Docker kontejneraW6WORKER
MASTERAPI · Cron · Orkestrator · Frontend
W1ATS Crawler · 13 Enricher demona
W2Karijerne strane · Triple Enricher · Contact Completer
W3Career HTML · PDF ekstrakcija · Description shards 3–4
DBPostgreSQL 15 Primary · PgBouncer pool
W5Description shards 5–7 · Residential proxy scraper
W6Geo-Discovery · 25 Docker kontejnera

Pipeline

8-shard Description Pipeline (otporan)

  1. 01Sharding preko hashtext — deterministička raspodela na 8 particija
  2. 02Za svaki shard poseban Python proces + posebna log datoteka
  3. 03Endless-Reconnect sa eksponencijalnim backoff-om [1,2,4,8,16,30]s
  4. 04Mini-batch commit svakih 50 redova — idempotentno, čisti UPDATE
  5. 05Daemon-Keeper sa Telegram alertima — auto-restart kod pada + log-tail + OOM provera

Tehnološki stack

Next.js 14 (App Router + Pages)FastAPI · UvicornPostgreSQL 15 · PgBouncerRedisPlaywrightDocker Composesystemd · cronSendGridCloudflare WorkersTelegram Bot APIIPRoyal (residential)nginx · Let's Encrypt

Rezultat

Od lansiranja: 99,9 %+ uptime. Pokrivenost opisa 84 %, pokrivenost e-pošte 65 %, quality-score na putu ka 80 %. Pipeline se izvršava dnevno 04:30–07:30 bez intervencije. Dvogodišnji plan dorada postao je nepotreban zahvaljujući jedinstvenom connection managementu i cluster-wide daemon-keeper-u.

Sličan poduhvat?

Pišite nam — prvo slušamo, pa isporučujemo.

Zatraži projekat