Hybrid retrieval (BM25 + dense), cross-encoder reranking, knowledge graph entity boost, evidence tier scoring, freshness decay. Geen prototype — production-grade.
Pinecone of Weaviate kies je in een dag, dan komt het werk: chunking, reranking, scoring, freshness, observability. RAG-tax wordt onderschat.
Het model verzint feiten als de context niet relevant genoeg is. Zonder relevance gate, evidence tiers en source attribution gebeurt dit met regelmaat.
Te veel chunks injecteren leidt tot verdunning; te weinig leidt tot incomplete antwoorden. Slim selecteren is een aparte engineering-discipline.
Zoekt door tickets, docs, releasenotes. Cross-encoder kiest de 8 meest relevante; LLM antwoordt grounded. Hallucinaties uitgesloten.
Wikipedia-stijl bot voor je hele bedrijf. Per-team scoping, freshness alerts, audit logs voor compliance.
Legal, medical, financial — domeinen waar accuraatheid kritiek is. Evidence tier scoring zorgt dat regelgeving zwaarder weegt dan blogposts.
BM25 (lexical) + dense embeddings (semantisch) + Reciprocal Rank Fusion. Vindt zowel exacte termen ("artikel 6 lid 1") als intentie.
Top-30 kandidaten worden door een cross-encoder herordend op echte relevantie voor de query. Top-8 gaat naar LLM.
Regelgeving > structured > tekst > image. Vers (<30d: 1.0) tot oud (>365d: 0.80). Composiet score = rerank × tier × decay.