Hoe AI-zoekarchitectuur werkt

Als je een vraag stelt aan een AI-zoeksysteem zoals AI Overviews of ChatGPT, voelt het antwoord ogenblikkelijk aan. Je typt iets, je krijgt een antwoord. Maar in die fractie van een seconde gebeurt er onder de motorkap iets dat fundamenteel verschilt van klassieke zoekmachines. En als je wil dat jouw content wordt opgepikt door deze systemen, moet je begrijpen hoe die machine werkt.

In dit artikel leg ik de AI-zoekarchitectuur uit in mensentaal: van het hallucinatieprobleem dat alles in gang zet, via query fan-out en de retrieval-pijplijn, tot wat het model écht van jouw pagina ziet. Dit is de technische basis onder de ultieme GEO-handleiding, waarbij GEO staat voor generative engine optimization.

Direct toepassen: laat onze GEO-check zien welke AI-signalen je pagina mist.

Waarom AI-zoeken bestaat: het hallucinatieprobleem

Grote taalmodellen (LLM’s) zijn getraind op enorme hoeveelheden tekst. Ze leren patronen en verbanden, waardoor ze vlot klinkende antwoorden kunnen genereren. Maar daar zit meteen de beperking: een model “kent” alleen wat in zijn trainingsdata zat, en het heeft geen betrouwbare manier om te weten of het iets écht weet of gewoon iets aannemelijks verzint.

Dat is het hallucinatieprobleem. Vraag een model naar een recente gebeurtenis na zijn trainingsdatum, en het verzint mogelijk een geloofwaardig maar volledig fictief antwoord. De vloeiende stijl zegt niets over de juistheid.

Voor creatief schrijven is dat beheersbaar. Voor zoeken, waar mensen accurate en actuele informatie verwachten, is het onaanvaardbaar. De oplossing heet grounding: de parametrische kennis van het model (wat in de gewichten zit) aanvullen met opgehaalde kennis (wat in realtime uit externe bronnen wordt gehaald). Een gegrond antwoord zegt eigenlijk: “Ik heb dit net gevonden, bij deze bronnen, en ik vat het voor je samen.”

Grounding maakt van een taalmodel iets dat lijkt op een research-assistent: het kan actuele info raadplegen, bronnen citeren en toegeven dat het iets niet weet. Dit is de architectuur achter AI Overviews en elke serieuze AI-zoekimplementatie. Wil je dieper ingaan op dit mechanisme, lees dan mijn artikel over grounding.

Query fan-out: hoe AI zichzelf googelt

Hier wordt de architectuur écht interessant.

Bij klassiek zoeken matcht je exacte zoekopdracht tegen een index. Eén zoekopdracht, één zoekactie, één resultatenset. AI-zoeken werkt anders: bij een complexe vraag zoekt het model niet één keer, maar vele keren.

Neem deze vraag: “Wat zijn de beste strategieën om zichtbaarheid in AI-zoeken te verbeteren voor e-commerce merken?” Een AI-systeem herkent dat die vraag meerdere dimensies heeft en breekt ze op in deelvragen, bijvoorbeeld:

Wat is AI-zoeken?
Hoe verschilt AI-zoeken van klassiek zoeken?
Welke uitdagingen hebben e-commerce merken specifiek?
Welke optimalisatiestrategieën bestaan er voor AI-zichtbaarheid?
Welke voorbeelden of cases tonen succes aan?

Het model voert die deelvragen uit (soms na elkaar, soms parallel) tegen een zoekinfrastructuur. Elke deelvraag levert eigen resultaten op, en daarna synthetiseert het model alles tot één antwoord. Dit heet query fan-out: de vraag “waaiert uit” naar meerdere zoekacties.

De impact is groot. Vroeger optimaliseerde je voor specifieke keyword-zoekopdrachten. Nu kan jouw content opgehaald worden voor vragen die je nooit had voorzien. Je pagina over “conversieoptimalisatie in webshops” kan opduiken in een antwoord over “AI-zichtbaarheidsstrategieën”, omdat het model een relevant verband legde. Het optimalisatie-oppervlak wordt daardoor veel breder dan vroeger.

De retrieval-pijplijn: van duizenden URL’s naar één antwoord

Wat gebeurt er nadat het model zijn fan-out-vragen heeft gegenereerd? De informatie loopt door een pijplijn met vier fasen.

Fase 1: snelle retrieval

De deelvragen raken een zoekinfrastructuur. Bij Google is dat een lichte, gecachete versie van de index, geoptimaliseerd voor snelheid. Dit is niet de volledige zoekervaring met alle rankingsignalen, maar een snelle laag die kandidaat-documenten vlot oplevert. Denk aan een eerste veeg: verzamel alles wat relevant kan zijn, kwaliteit komt later. Deze fase levert mogelijk duizenden kandidaat-URL’s op, veel meer dan ooit gebruikt kan worden.

Fase 2: filteren

Een classifier beoordeelt die kandidaten en filtert ze tot een hanteerbare set. Dat gebeurt op basis van relevantie, autoriteit, versheid en andere signalen. Maar het is geen klassieke ranking, eerder triage: bepalen welke kandidaten een diepere blik verdienen.

Deze fase wordt vaak onderschat. Pagina’s die goed scoren in klassiek zoeken, vallen hier soms af omdat ze de kwaliteitsdrempel voor grounding niet halen. Omgekeerd halen pagina’s die in klassiek zoeken laag staan de filter wél, omdat hun content goed gestructureerd is voor extractie. De filtercriteria zijn dus niet identiek aan rankingcriteria, en dat is precies waarom klassieke rank tracking maar een halve waarheid vertelt over je AI-zichtbaarheid.

Fase 3: content extractie

Voor de pagina’s die de filter overleven, haalt het systeem de inhoud op en haalt het relevante passages eruit. Hier wordt je zorgvuldig ontworpen pagina herleid tot tekstblokken (chunks).

Het model ziet je pagina niet zoals een bezoeker. Geen hero-afbeelding, geen merkkleuren, geen navigatie. Het krijgt iets dat dichter bij ruwe tekst ligt, soms met basis-HTML-structuur zoals headers en vetgedrukte tekst, maar in essentie gewoon woorden. Als je betekenis afhangt van visuele context (een infographic zonder alt-tekst, betekenis via layout in plaats van taal), dan vangt het model die betekenis niet op.

Fase 4: selectie en synthese

Tot slot beoordeelt het model de geëxtraheerde passages tegen de oorspronkelijke vraag en kiest het welke het opneemt in het antwoord. Dat is het selectiemoment: wordt jouw content deel van het antwoord, of blijft ze ongebruikt?

Selectie is niet binair. Het model kan je content uitgebreid citeren als hoofdbron, of er één zin uit halen vermengd met vijf andere bronnen, of je passages ophalen en alsnog beslissen dat alternatieven beter zijn. Zo wordt selectiegraad meetbaar: hoe vaak wordt je content, eens opgehaald, ook echt geselecteerd?

Wat het model echt van je pagina ziet

Dit punt wordt vaak verkeerd begrepen, en dat misverstand leidt tot foute optimalisatie. Veel mensen denken dat AI een soort screenshot van je pagina maakt. Dat klopt niet. Het model ziet tekst, en specifiek tekst die door de pijplijn is gehaald en van visuele opmaak is ontdaan.

In sommige implementaties overleeft basis-HTML-structuur: het model ziet dat tekst in een <h2> of vetgedrukt stond, en herkent lijsten. Maar fonts, kleuren, spacing en afbeeldingen overleven niet. Schema-markup en gestructureerde data zitten in een grijze zone: sommige systemen gebruiken ze, andere negeren ze.

De praktische les: inhoudelijke kwaliteit telt meer dan visuele afwerking. Een mooi vormgegeven pagina met middelmatige tekst verliest van een lelijke pagina met uitstekende tekst. De AI kijkt door de designlaag heen naar de inhoud eronder.

De valkuil van contextuele instorting

Op een goed opgebouwde website bestaat content in context. Een productpagina vermeldt de productnaam in de header, zodat de bodytekst voornaamwoorden kan gebruiken: “Het beschikt over geavanceerde ruisonderdrukking.” Dat werkt voor een mens die de hele pagina ziet. Het faalt volledig bij AI-extractie.

Wanneer het model een passage uit het midden van je pagina haalt, krijgt het enkel die passage. Staat er “Het beschikt over geavanceerde ruisonderdrukking”, dan weet het model niet waar “het” naar verwijst. De context reisde niet mee. Ik noem dit contextuele instorting.

De oplossing is content waarin elke sectie en elke alinea op zichzelf staat. De entiteitsnamen, de productnamen, de expliciete vermelding van waar je het over hebt: die moeten in elke logische eenheid terugkomen. Dat voelt repetitief als je de pagina in zijn geheel leest, maar de AI leest nooit het geheel. Ze leest losse chunks, en die moeten zelfstandig leesbaar zijn.

Multi-bron synthese: van positie naar aandeel

Klassiek zoeken gaf je een lijst bronnen. De gebruiker koos welke te bezoeken, en elke bron stond op zichzelf. AI-zoeken synthetiseert over bronnen heen: één alinea AI-antwoord kan een statistiek uit bron A, een uitleg uit bron B en een voorbeeld uit bron C combineren.

Dat creëert een nieuwe concurrentiedynamiek. Vroeger streed je om positie, nu strijd je om aandeel in de synthese. Stel dat een antwoord vijf bronnen gebruikt: één bron levert misschien 60% van de inhoud (de hoofdbron, zwaar geciteerd), één 20%, en drie andere elk 5%. De hoofdbron vangt onevenredig veel waarde: merkzichtbaarheid, mogelijke doorklik, autoriteit. De kleine bronnen zijn vrijwel onzichtbaar.

Daarom is selectiegraad alleen onvolledig als maatstaf. Je wil ook integratiediepte meten: hoe substantieel draagt je content bij wanneer ze geselecteerd wordt?

Platformverschillen

De architectuur verschilt per platform, en dat is relevant voor je strategie:

Platform	Groundingpatroon	Gevolg voor optimalisatie
Google	Eén feit, meerdere bronnen die elkaar bevestigen (consensus)	Content wint bij claims die andere autoriteiten ook maken
OpenAI (ChatGPT)	Eén claim, één bron (winner-take-all)	Differentiatie telt: de enige beste bron zijn voor een claim

Google beloont met andere woorden overeenstemming en goed gestructureerde content met duidelijke hiërarchie. ChatGPT beloont eerder uitgebreide, onderscheidende content die als primaire bron kan dienen. “AI-zoeken” is dus niet één ding, en optimalisatie houdt best rekening met die variatie.

De groundingbeslissing: niet elke vraag triggert retrieval

Een nuance die velen missen: niet elke vraag activeert grounding. Vraagt een gebruiker iets waar het model zeker van is (basisfeiten, breed verspreide kennis), dan antwoordt het mogelijk uit parametrische kennis alleen. Geen zoekactie, geen retrieval, geen kans voor jouw content om geselecteerd te worden.

Vraagt iemand iets waar het model minder zeker over is (recente gebeurtenissen, gespecialiseerde onderwerpen, actuele info), dan triggert het grounding. Het zoekt, haalt op en synthetiseert. Die beslissing valt automatisch, op basis van het zelfvertrouwen van het model.

Vragen die meestal grounding triggeren:

Recente gebeurtenissen en actuele informatie
Gespecialiseerde of technische onderwerpen
Vragen om specifieke feiten of cijfers
Vergelijkende vragen (“beste”, “top”, “aanbevolen”)
Lokale of tijdgevoelige informatie

Vragen met lage grounding:

Vastgestelde feiten (“Wat is de hoofdstad van Frankrijk?”)
Conceptuele uitleg binnen de training van het model
Algemene kennis die breed in de trainingsdata zit

Vallen jouw doelvragen in de lage-groundingcategorie, dan heeft contentoptimalisatie beperkte impact en is het beïnvloeden van de trainingsdata zelf je enige (veel langzamere) pad. Vallen ze in de hoge-groundingcategorie, dan kan optimalisatie meteen effect hebben: elke vraag is een kans om opgehaald en geselecteerd te worden. Omdat die beslissing per keer kan verschillen, is AI-zoeken inherent grillig. Meer daarover lees je in mijn artikel over de probabilistische aard van AI-antwoorden.

De AI als nieuwe eerste lezer

Twee decennia lang dachten we aan twee doelgroepen: mensen en zoekmachines. AI-zoeken introduceert een nieuwe primaire lezer: de AI zelf. De AI leest, evalueert, extraheert en synthetiseert jouw content vóór een mens iets ziet. Selecteert de AI je content niet, dan komt de mens ze nooit tegen. De AI is de poortwachter.

Maar de AI leest anders. Ze ervaart je design niet en telt niet zomaar keywords: ze begrijpt betekenis, beoordeelt kwaliteit en oordeelt over bruikbaarheid, maar ontdaan van alle visuele en emotionele context. Content die leunt op visuele context, voornaamwoorden zonder antecedent of de aanname dat de lezer de hele pagina zag, wordt ontmaskerd. Content die met precisie en helderheid communiceert, wordt beloond.

Dat is een hogere lat dan klassieke SEO vroeg. Op een vreemde manier dwingt de AI-lezer ons om betere communicators te worden, en wie aan haar eisen voldoet, voldoet meestal ook beter aan de eisen van menselijke lezers. Wil je dit afzetten tegen de oude aanpak, lees dan GEO vs SEO.

Veelgestelde vragen

Wat is query fan-out precies?

Query fan-out is het mechanisme waarbij een AI-zoeksysteem jouw ene vraag opsplitst in meerdere deelvragen en die elk apart uitvoert tegen een zoekinfrastructuur. Vervolgens combineert het de resultaten van al die deelvragen tot één samenhangend antwoord. Daardoor kan jouw content opduiken voor vragen die je nooit letterlijk had geoptimaliseerd.

Ziet een AI-model mijn pagina zoals een bezoeker?

Nee. Het model ziet vooral tekst, niet je design. Soms overleeft basis-HTML-structuur zoals koppen en vetgedrukte tekst, maar fonts, kleuren, afbeeldingen en layout verdwijnen. Daarom telt de inhoudelijke kwaliteit van je tekst zwaarder dan de visuele afwerking van je pagina.

Wat is contextuele instorting en hoe vermijd ik het?

Contextuele instorting gebeurt wanneer de AI een passage uit het midden van je pagina haalt zonder de omringende context. Voornaamwoorden zoals “het” of “wij” worden dan betekenisloos. Je vermijdt het door elke sectie en alinea zelfstandig leesbaar te maken: herhaal entiteits- en productnamen en zeg expliciet waar je het over hebt.

Triggert elke zoekvraag retrieval in AI-zoeken?

Nee. Bij vragen waar het model zeker van is, antwoordt het soms uit zijn eigen parametrische kennis zonder iets op te halen. Pas bij onzekere, actuele of gespecialiseerde vragen triggert het grounding en haalt het externe bronnen op. Alleen bij die grounded vragen kan jouw content meedingen om geselecteerd te worden.