RAG-platform

RAG die écht werkt in productie.

Hybrid retrieval (BM25 + dense), cross-encoder reranking, knowledge graph entity boost, evidence tier scoring, freshness decay. Geen prototype — production-grade.

GDPR Compliant EU Servers No Vendor Lock-in AI Act Ready
[01] De kern van het probleem

Wat zit teams in de weg.

01

Een vector database alleen is niet genoeg

Pinecone of Weaviate kies je in een dag, dan komt het werk: chunking, reranking, scoring, freshness, observability. RAG-tax wordt onderschat.

02

Hallucinaties in productie

Het model verzint feiten als de context niet relevant genoeg is. Zonder relevance gate, evidence tiers en source attribution gebeurt dit met regelmaat.

03

Context window is altijd te klein

Te veel chunks injecteren leidt tot verdunning; te weinig leidt tot incomplete antwoorden. Slim selecteren is een aparte engineering-discipline.

[02] Use cases

Wat je met onze RAG-laag bouwt.

01

Customer support copilot

Zoekt door tickets, docs, releasenotes. Cross-encoder kiest de 8 meest relevante; LLM antwoordt grounded. Hallucinaties uitgesloten.

02

Internal Q&A

Wikipedia-stijl bot voor je hele bedrijf. Per-team scoping, freshness alerts, audit logs voor compliance.

03

Domain-specific assistants

Legal, medical, financial — domeinen waar accuraatheid kritiek is. Evidence tier scoring zorgt dat regelgeving zwaarder weegt dan blogposts.

[03] Hoe TalkWithData het oplost

Wat onze pipeline doet (geen black box).

01

Hybrid retrieval

BM25 (lexical) + dense embeddings (semantisch) + Reciprocal Rank Fusion. Vindt zowel exacte termen ("artikel 6 lid 1") als intentie.

02

Cross-encoder reranking

Top-30 kandidaten worden door een cross-encoder herordend op echte relevantie voor de query. Top-8 gaat naar LLM.

03

Evidence tier + temporal decay

Regelgeving > structured > tekst > image. Vers (<30d: 1.0) tot oud (>365d: 0.80). Composiet score = rerank × tier × decay.

[04] Veelgestelde vragen

Antwoorden, niet markeringen.

ChromaDB voor vectoren, PostgreSQL voor metadata. Beide EU-gehost. Migratie naar enterprise vector-DB (pgvector, Qdrant) op aanvraag voor grote volumes.
Built-in eval suite: precision@8, MRR, faithfulness (geen hallucinaties), answer relevance. Reports per kennisbank, trends over tijd.
Ja. Default OpenAI text-embedding-3-small; switchen naar Cohere, Mistral-embed of self-hosted (BGE-M3) configureerbaar. Per kennisbank.

Skip de RAG-engineering.

Production-grade pipeline, ready in 5 minuten.