Am proiectat o bază de cunoștințe alimentată de AI și o platformă de comunicații interne pentru cel mai important brand de bijuterii de lux din România — o arhitectură cu trei servicii în Go, React și Python care transformă documentele interne în răspunsuri instantanee cu surse citate, interogând simultan date CRM live prin limbaj natural.
Provocarea
Forța de muncă Teilor se înneca în cunoștințe instituționale risipite în sute de documente interne — PDF-uri, prezentări, foi de calcul și manuale de proceduri — fără nicio modalitate de a obține răspunsuri fără a căuta manual prin fișiere. În plus, angajații aveau nevoie constantă de acces la date CRM live — cataloage de produse, fișe clienți, comenzi, facturi și oportunități de vânzare — dar interfața ERP existentă era complexă și neintuitivă. Compania avea nevoie de un asistent AI capabil să ingere și să înțeleagă întreaga bibliotecă de documente, să răspundă la întrebări cu citări precise ale surselor, să acceseze direct CRM-ul pentru date de business în timp real și să funcționeze și ca platformă de mesagerie internă — totul suportând română și engleză, implementat pe infrastructura proprie cu suveranitate completă a datelor.
Soluția noastră
Am construit o arhitectură cu trei servicii, fiecare în limbajul cel mai potrivit rolului său. Backend-ul principal este scris în Go, orchestrând un pipeline RAG complet: documentele trec prin Docling pentru parsarea inteligentă a PDF-urilor, DOCX, PPTX, HTML și imaginilor, apoi sunt fragmentate și vectorizate folosind modelul multilingv bge-m3 via Ollama și indexate în baza de date vectorială Qdrant pentru căutare semantică. Un motor de clasificare a interogărilor rutează fiecare întrebare — decidând dacă să caute în documente, să invoce unelte CRM sau să o gestioneze ca conversație generală. Sistemul de plugin-uri CRM se conectează la ERP-ul Opal al Teilor printr-un framework REST cu autentificare dinamică bearer, transmițând credențialele proprii ale fiecărui utilizator pentru a interoga produse, clienți, comenzi, facturi și oportunități în timp real. Răspunsurile AI sunt transmise în streaming prin Server-Sent Events alimentate de Anthropic Claude, cu fiecare răspuns fundamentat în citări ale surselor. PostgreSQL gestionează persistența și alimentează River pentru procesare fiabilă a sarcinilor de fundal cu reîncercări. Un microserviciu Python FastAPI rulează cross-encoderul BAAI/bge-reranker-v2-m3 pentru re-clasarea rezultatelor căutării cu precizie. Frontend-ul este o aplicație React 19 folosind React Compiler pentru memoizare automată, construit cu Vite 7, TanStack Query pentru fetching de date, Zustand pentru gestionarea stării și Radix UI cu Tailwind CSS v4. Mesageria WebSocket în timp real suportă conversații directe și de grup cu indicatori de prezență, confirmări de citire, atașamente de fișiere și notificări push. Întreaga platformă este livrată ca Progressive Web App cu i18next alimentând internaționalizarea în română și engleză.
Rezultate
- Am construit pipeline RAG complet ingerând PDF, DOCX, PPTX, HTML și imagini cu parsare Docling și indexare vectorială Qdrant
- Am proiectat chat AI în streaming cu Anthropic Claude livrând răspunsuri cu surse citate prin Server-Sent Events
- Am integrat sistem de plugin-uri CRM interogând date Opal ERP live cu transmiterea credențialelor per utilizator
- Am implementat microserviciu de re-clasare cu cross-encoder BAAI/bge-reranker-v2-m3 pentru precizie multilingvă
- Am construit mesagerie WebSocket în timp real cu prezență, confirmări de citire, atașamente și notificări push
- Am livrat PWA React 19 cu React Compiler, TanStack Query, Zustand și Radix UI pe Tailwind v4
- Am realizat suport complet pentru română și engleză în răspunsuri AI, interfață și înțelegerea documentelor