Customer Impact

SEO

Orphan pages opsporen: waardevolle pagina's die niemand intern linkt

Een orphan page, of weespagina, is een pagina op je site waar geen enkele andere pagina naar linkt. Het korte antwoord: omdat crawlers het web volgen via links, vinden ze zo’n pagina nauwelijks, krijgt ze vrijwel geen interne autoriteit en blijft ze onzichtbaar in de zoekresultaten. Het vervelende is dat het vaak je waardevolle pagina’s zijn die verweesd raken: een oude dienstpagina, een goed artikel, een productpagina die bij een redesign uit het menu viel. In dit artikel lees je hoe je ze systematisch opspoort met crawl-, logfile- en sitemap-data, en hoe je beslist wat ermee moet gebeuren.

Wat is een orphan page precies?

Zoekmachines ontdekken pagina’s grotendeels door links te volgen. Vanaf je homepage hopt een crawler naar je menu, naar categoriepagina’s, naar artikels en dienstpagina’s. Elke pagina die in dat netwerk hangt, wordt gevonden. Een orphan page zit buiten dat netwerk: er loopt geen enkele interne link naartoe, dus de crawler heeft geen pad om er te komen.

Dat is iets anders dan een pagina die slecht gelinkt is. Een pagina met één enkele link diep in je site is zwak gepositioneerd, maar nog steeds bereikbaar. Een echte weespagina heeft nul interne links. Ze bestaat wel, je kan ze via de directe URL openen, maar binnen je interne linkstructuur is ze er niet.

Waarom gebeurt dit zo vaak? De meest voorkomende oorzaken zijn een websitemigratie waarbij links niet meegenomen werden, producten of pagina’s die uit een menu of filter verdwenen, geïmporteerde content die nooit ingelinkt werd, en losse landingspagina’s voor campagnes die buiten de hoofdstructuur leven. Hoe groter en ouder je site, hoe meer wezen er stilletjes ontstaan.

Waarom een gewone crawl ze niet vindt

Hier zit de valkuil. Tools zoals Screaming Frog crawlen je site net zoals Google: ze starten op de homepage en volgen links. Maar precies omdat een orphan page geen interne links heeft, kan zo’n crawl ze per definitie niet bereiken. De pagina die je wil vinden, is onzichtbaar voor de methode die je gebruikt.

De oplossing is om de crawl te vergelijken met bronnen die pagina’s kennen via een ander kanaal dan interne links. Een orphan page komt namelijk nog steeds voor in je XML-sitemap, in je analytics als ze bezoek krijgt, en in je serverlogs als een bot of bezoeker ze ooit opent. Door die lijsten naast je crawl te leggen, vallen de pagina’s op die wél bestaan maar in de crawl ontbreken.

Vind weespagina’s via sitemap-data

De snelste eerste stap is je XML-sitemap. Je sitemap is in principe je eigen complete inventaris van pagina’s die je geïndexeerd wil zien. Veel SEO-crawlers laten je toe om naast de gewone crawl ook de sitemap-URL’s mee te laden. De tool crawlt dan je site én leest je sitemap, en zet beide lijsten tegenover elkaar.

Wat je zoekt zijn de URL’s die in de sitemap staan maar niet in de crawl opduiken. Dat zijn pagina’s die je belangrijk genoeg vond om in de sitemap te zetten, maar waar nergens in je site naartoe gelinkt wordt. Dat is je eerste, meest betrouwbare lijst van verdachte weespagina’s. Houd er rekening mee dat je sitemap zelf actueel en volledig moet zijn, anders mis je net de pagina’s die er niet in staan.

Vind weespagina’s via analytics en Search Console

Je analytics-pakket en Google Search Console kennen pagina’s die ooit bezocht of weergegeven werden, los van je interne links. Exporteer de lijst van URL’s die in de afgelopen maanden bezoek of vertoningen kregen, en vergelijk die met je crawl.

Een pagina die verkeer of impressies binnenhaalt maar niet in je crawl zit, is dubbel interessant: ze presteert al ondanks dat ze verweesd is. Dat is vaak een pagina die je makkelijk verder kan laten groeien door er een paar interne links naartoe te leggen. In Search Console kan je daarnaast in het paginarapport zien welke URL’s Google geïndexeerd heeft. Staat een geïndexeerde, presterende pagina niet in je interne linknetwerk, dan laat je rankingpotentieel liggen.

Let bij deze bron op één detail. Analytics kent enkel pagina’s die de afgelopen periode bezoek kregen. Een waardevolle pagina die al langer geen verkeer trekt, juist omdat ze verweesd is, kan zo onder de radar blijven. Daarom combineer je analytics altijd met je sitemap en logs: pas wanneer je de drie bronnen samenbrengt, krijg je een volledig beeld van wat er buiten je structuur leeft. Hoe je überhaupt zorgt dat pagina’s in de index belanden, lees je in ons artikel over je website laten indexeren.

Vind weespagina’s via logfile-analyse

De grondigste bron zijn je serverlogs. Een logfile registreert elk verzoek aan je server: welke URL werd opgevraagd, door welke bot of bezoeker, en wanneer. Daarmee zie je de ruwe werkelijkheid van hoe Googlebot je site in de praktijk crawlt, niet hoe je denkt dat hij dat doet.

Voor het opsporen van orphan pages doe je twee dingen. Ten eerste haal je uit de logs alle unieke URL’s die opgevraagd zijn en vergelijk je die met je crawl: pagina’s die in de logs zitten maar niet in de crawl zijn kandidaat-wezen. Ten tweede zie je welke pagina’s Googlebot zelden of nooit bezoekt, wat samenhangt met hoe je crawlbudget verdeeld wordt. Verweesde pagina’s krijgen doorgaans weinig botbezoek, omdat er geen links zijn die de bot ernaartoe sturen. Hoe je dat botverkeer leest, lichten we toe in ons artikel over de crawlstatistieken in Search Console.

Logfile-analyse is bewerkelijker dan een sitemap-export en vraagt toegang tot je serverlogs, die niet elke hosting standaard ontsluit. Voor een kleine site is het vaak overkill en volstaan sitemap en analytics. Voor grote sites met duizenden pagina’s, waar crawlbudget echt telt, is het de enige manier om met zekerheid te zien welke pagina’s Google in de praktijk negeert. Schaal je inspanning dus naar de omvang en de inzet van je site.

Niet elke wees hoort terug in je structuur

Voor je begint te linken: niet elke orphan page is een fout. Sommige pagina’s zijn bewust verweesd en dat hoort zo. Denk aan bedankpagina’s na een formulier, aparte landingspagina’s voor een betaalde campagne, of pagina’s die je expliciet uit de organische index wil houden. Die wil je niet plots in je menu of content gaan inlinken.

Beoordeel daarom elke gevonden pagina op bedoeling. Grofweg vallen ze in drie categorieën. Waardevolle pagina’s die per ongeluk verweesd raakten trek je terug in je structuur met relevante interne links. Verouderde of dunne pagina’s zonder waarde kan je beter samenvoegen, herschrijven of via een redirect afvoeren. Bewust verweesde pagina’s laat je met rust, eventueel met een noindex zodat het signaal klopt. Die afweging is precies waar een goede seo specialist het verschil maakt: niet blind alles inlinken, maar kiezen wat bijdraagt aan pipeline.

Van opsporen naar inlinken

Voor de pagina’s die wél terug moeten, is de fix vaak verrassend eenvoudig. Zoek bestaande pagina’s die thematisch verwant zijn en voeg daar een natuurlijke, contextuele link naartoe toe. Een paar relevante links vanuit sterke, bestaande content geven de pagina alsnog crawlpaden en interne autoriteit. Een logische plek in je website-architectuur zorgt dat de winst blijvend is in plaats van eenmalig.

Belangrijk is de volgorde van je optimalisaties. Eerst opsporen via sitemap, analytics en logs. Dan beoordelen op bedoeling. Dan pas linken, mergen of afvoeren. Wie meteen begint met links leggen zonder de waarde te checken, vervuilt zijn structuur opnieuw.

Bij Customer Impact behandelen we orphan pages niet als een losse technische opkuis, maar als onderdeel van één groei-engine: SEO is de acquisitielaag die je niet alleen laat ranken, maar je ook geciteerd krijgt in AI-zoekmachines zoals ChatGPT en Google AI. Het doel is nooit een mooie lijst opgeloste wezen, maar pagina’s die effectief bijdragen aan aanvragen. Meer over die aanpak lees je op de pijlerpagina over wat SEO is.

Wil je weten welke waardevolle pagina’s op jouw site onzichtbaar in de marge hangen? Neem contact op en we brengen je verweesde pagina’s en hun potentieel in kaart.

Onderdeel van de gids Wat is SEO? Uitleg, werking en waarom het werkt

Gratis website-scan

Geef je website in en krijg binnen enkele minuten een automatische scan met concrete technische en SEO-verbeterpunten. Geen verkooppraatje.

Waar mogen we je rapport naartoe sturen?

Je gegevens gebruiken we alleen voor je scan. Geen spam, uitschrijven kan altijd.

Deel je website voor een gratis zichtbaarheidsaudit