Website & Development
XML-sitemap en indexering bij een nieuwe website: zo help je Google je site begrijpen
Een XML-sitemap maken doe je door een lijst aan te leggen van de pagina’s die jij door Google opgenomen wil zien, en die als bestand op je domein te plaatsen en in te dienen via Google Search Console. Bij een nieuwe website is dat belangrijker dan veel mensen denken: zonder externe links die naar je verwijzen, is een sitemap vaak de snelste manier waarop Google je pagina’s ontdekt. In dit artikel lees je welke pagina’s wel en niet in je sitemap horen, hoe je robots.txt en noindex correct instelt tijdens de bouw, en hoe je alles netjes indient.
Wat is een XML-sitemap en waarom heb je er een nodig?
Een XML-sitemap is een gestructureerd bestand dat de belangrijkste URL’s van je site opsomt voor zoekmachines. Het vertelt Google: dit zijn de pagina’s die ertoe doen, kom ze gerust ophalen.
Belangrijk om te begrijpen: een sitemap is een hint, geen bevel. Google gebruikt het om je pagina’s sneller te ontdekken, maar beslist nog altijd zelf of het ze crawlt en opneemt. Een sitemap forceert dus geen indexering, en hoe dat indexeringsproces precies verloopt lees je in ons artikel over hoe je een website laat indexeren.
Voor een nieuwe site is dat ontdekkingsvoordeel reëel. Een bestaande site met veel binnenkomende links wordt vanzelf gevonden. Een vers domein heeft die signalen nog niet, dus een sitemap die je actief indient is dan een van je sterkste hulpmiddelen om vindbaar te worden.
De meeste platforms maken die sitemap automatisch. Webflow genereert er standaard een, en in WordPress doen plug-ins zoals Yoast, Rank Math of All in One SEO dat voor je. Je hoeft het bestand dus zelden met de hand te schrijven. De kunst zit in de inhoud: welke pagina’s laat je erin staan, en welke niet.
Welke pagina’s horen wel en niet in je sitemap?
De regel is simpel: in je sitemap horen alleen indexeerbare, waardevolle eindpagina’s die je daadwerkelijk in de zoekresultaten wil zien.
Wel opnemen:
- Je homepage, dienstenpagina’s en belangrijke landingspagina’s.
- Kennisartikelen, blogposts en cases die bezoekers en leads opleveren.
- Contact- en over-onspagina’s die mee vertrouwen opbouwen.
Niet opnemen:
- Bedankt- en bevestigingspagina’s na een formulier.
- Inlog-, account- en checkoutachtige pagina’s.
- Interne zoekresultaten en gefilterde overzichten die eindeloze varianten genereren.
- Test-, staging- of duplicaatpagina’s.
- Pagina’s met een noindex-tag of pagina’s die een redirect of foutmelding teruggeven.
Een veelgemaakte fout is een sitemap die alles dumpt wat het CMS produceert. Dat verwatert het signaal: je laat Google dan crawlbudget besteden aan pagina’s die niets opleveren. Hou de lijst schoon en gericht op pagina’s die bezoekers in leads kunnen omzetten. Welke pagina’s dat zijn, hangt nauw samen met hoe je je website-architectuur opbouwt voor SEO: een logische structuur met duidelijke interne links maakt je sitemap bijna vanzelf netjes.
Technisch geldt per sitemapbestand een grens van 50.000 URL’s en 50 MB ongecomprimeerd. Voor een B2B-site haal je die zelden, maar zit je erboven, dan split je op in meerdere bestanden en verwijs je ernaar met een sitemap-indexbestand.
Hoe gebruik je robots.txt en noindex zonder fouten?
Robots.txt en noindex lijken op elkaar, maar doen iets fundamenteel verschillends, en juist daar gaat het vaak mis. Robots.txt regelt of een bot een pagina mag crawlen. De noindex-tag regelt of een pagina in de index mag verschijnen.
Dat onderscheid is cruciaal door één valkuil. Als je een pagina blokkeert in robots.txt, kan Google de pagina niet bezoeken, en dus ook de noindex-tag op die pagina niet lezen. Het gevolg: wil je een pagina echt uit de zoekresultaten houden, dan zet je er een noindex-tag op en laat je hem juist wel crawlbaar. Blokkeer je hem in robots.txt, dan kan hij alsnog in de resultaten opduiken zonder dat je hem eruit krijgt.
Een paar praktische richtlijnen voor een nieuwe site:
- Tijdens de bouw wil je niet dat Google de site oppikt. De veiligste aanpak is dan de hele staging-omgeving achter een wachtwoord of HTTP-authenticatie zetten. Vertrouw niet alleen op robots.txt om een site verborgen te houden, want dat blokkeert het crawlen, niet de zichtbaarheid.
- Vergeet geen blokkades te verwijderen bij lancering. De klassieke ramp is een site die live gaat terwijl er nog een sitebrede noindex of een blokkerende robots.txt op staat uit de bouwfase. Dan staat je nieuwe site er prachtig bij, maar verschijnt ze nergens. Dit is ook een van de risico’s bij een verhuizing; lees daarom hoe je een website migreert zonder rankingverlies.
- Gebruik noindex bewust voor pagina’s die nodig zijn maar niet in Google horen, zoals bedankpagina’s en dunne tag-overzichten.
- Laat robots.txt naar je sitemap verwijzen met een regel die de locatie van je sitemap aangeeft. Dat helpt zoekmachines het bestand te vinden.
Zorg dat de pagina’s in je sitemap en je noindex-keuzes consistent zijn. Een pagina die je op noindex zet maar wel in je sitemap laat staan, geeft tegenstrijdige signalen.
Hoe dien je je sitemap in bij Google Search Console?
Je dient je sitemap in door je site eerst te verifiëren in Google Search Console en daarna in het sitemaprapport de URL van je sitemap toe te voegen. Dat is een gratis stap en voor een nieuwe site een van de eerste dingen die je doet.
In grote lijnen:
- Maak een gratis Google Search Console-account aan en voeg je domein toe als property.
- Verifieer dat je eigenaar bent, doorgaans via een DNS-record of een verificatiebestand. Veel CMS’en hebben hiervoor een ingebouwde optie.
- Ga naar het sitemaprapport en geef het pad naar je sitemap op, meestal iets als sitemap.xml.
- Controleer na een tijdje of Google de sitemap kon lezen en hoeveel URL’s het heeft ontdekt.
Daarna kan je in Search Console blijven volgen welke pagina’s worden opgenomen en welke niet, en waarom. Wil je een specifieke nieuwe pagina sneller laten oppikken, dan kan je via de URL-inspectie indexering aanvragen. Hou er wel rekening mee dat Google uiteindelijk zelf beslist; indienen versnelt de ontdekking, maar dwingt niets af.
Wanneer regel je dit tijdens de bouw van een nieuwe site?
Het juiste moment is tijdens de bouw, niet als nazorg na de lancering. Sitemap, robots.txt en je indexeringskeuzes zijn geen technische bijzaak, ze bepalen of je investering in een nieuwe site überhaupt vindbaar wordt.
Praktisch betekent dat: tijdens de bouw houd je de staging-omgeving afgeschermd, plan je welke pagina’s geïndexeerd mogen worden, en zet je tijdelijke blokkades op een checklist om bij livegang te verwijderen. Op lanceringsdag controleer je dat de sitebrede noindex weg is, dat robots.txt het crawlen toelaat, dat je sitemap de juiste pagina’s bevat, en dat je hem indient in Search Console. Die paar controles voorkomen de pijnlijkste fout in webdevelopment: een mooie nieuwe site die wekenlang onzichtbaar blijft.
Bij Customer Impact bouwen we conversiegerichte B2B-sites, en we zien deze configuratie als onderdeel van degelijk vakwerk, niet als losse extra. Een site die leads moet opleveren, moet eerst correct gevonden worden. Hoe wij die technische basis aanpakken, lees je op onze pagina over website laten maken, en de bredere context staat in onze gids over een B2B-website laten maken.
De korte samenvatting
Een XML-sitemap maken is niet ingewikkeld, maar de details bepalen het resultaat. Zet alleen waardevolle, indexeerbare eindpagina’s in je sitemap, gebruik robots.txt voor crawlen en noindex voor zichtbaarheid zonder ze door elkaar te halen, en dien je sitemap in via Search Console. Het allerbelangrijkste: regel dit tijdens de bouw en verwijder elke tijdelijke blokkade bij livegang, zodat je nieuwe site meteen door Google wordt begrepen.
Wil je zeker weten dat je nieuwe site technisch correct staat en ook echt leads oplevert? Plan je gratis intake en we kijken er samen naar.
Gratis website-scan
Geef je website in en krijg binnen enkele minuten een automatische scan met concrete technische en SEO-verbeterpunten. Geen verkooppraatje.
Je gegevens gebruiken we alleen voor je scan. Geen spam, uitschrijven kan altijd.