In dit artikel geven we tips over hoe je een geoptimaliseerde sitemap voor de Web Crawler kunt maken en welke best practices je kunt volgen.
Een goed gestructureerde .xml-sitemap is een essentieel onderdeel wanneer je de Web Crawler in Pulse gebruikt. Het zorgt ervoor dat alle belangrijke pagina’s van je website worden meegenomen in de crawl, zodat je chatbot toegang heeft tot de meest relevante inhoud.
Waarom is een sitemap belangrijk voor de Web Crawler?
Een sitemap is als een routekaart voor de Web Crawler. Het bevat een lijst van alle URLs op je website die je wilt laten crawlen. Door een goed georganiseerde sitemap te uploaden, zorg je ervoor dat de Web Crawler precies weet welke pagina’s moeten worden gecrawld en geïntegreerd in de kennisbasis van je chatbot.
Met een goed opgezette sitemap kan de Web Crawler:
- Toegang krijgen tot alle belangrijke pagina’s: Zorg ervoor dat belangrijke pagina’s (zoals productpagina’s, FAQs of blogs) zijn opgenomen.
- Tijd besparen: In plaats van handmatig afzonderlijke URLs toe te voegen, kan de Web Crawler je sitemap gebruiken om automatisch een lijst met alle belangrijke URLs op te halen.
- Zorgen voor nauwkeurige inhoud: Een sitemap zorgt ervoor dat je chatbot altijd up-to-date blijft met de meest actuele versie van de inhoud op je website.
Best practices voor een effectieve sitemap
Alleen belangrijke pagina’s opnemen
Zorg ervoor dat je sitemap alleen de meest relevante en belangrijke pagina’s bevat die je wilt laten crawlen door de Web Crawler. Vermijd het opnemen van irrelevante of dubbele content (zoals gefilterde versies van dezelfde pagina of admin-pagina’s).
Voorbeelden van belangrijke pagina’s om op te nemen:
- Homepage
- Product- of dienstpagina’s
- Blog- en FAQ-secties
- Contact- en prijspagina’s
Creëer een eenvoudige en duidelijke URL-structuur in je .xml-sitemap
Sitemaps moeten een duidelijke en georganiseerde URL-structuur volgen. Zorg ervoor dat je URLs schoon, beknopt en makkelijk te begrijpen zijn. We raden een structuur aan zoals hieronder weergegeven:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.example.com/foo.html</loc>
<lastmod>2022-06-04</lastmod>
</url>
</urlset>
Gebruik beschrijvende URLs
Zorg ervoor dat je URLs duidelijk zijn en de inhoud van de pagina beschrijven. Gebruik bijvoorbeeld /blog/best-practices-for-chatbots in plaats van /page?id=12345. Dit helpt zowel de Web Crawler als zoekmachines om beter te begrijpen waar elke pagina over gaat.
Beperk de grootte van je sitemap
Hoewel een sitemap veel URLs kan bevatten, raden we aan om elke sitemap te beperken tot 50.000 URLs of 50MB om prestatieproblemen te voorkomen. Als je website groot is, overweeg dan om de sitemap op te splitsen in meerdere bestanden zodat de Web Crawler deze gemakkelijker kan verwerken.
Voor meer informatie, zie Google’s richtlijnen over sitemaplimieten.
Houd je sitemap up-to-date
Wanneer je belangrijke inhoud aan je website toevoegt, verwijdert of wijzigt, zorg er dan voor dat je sitemap wordt bijgewerkt. Dit zorgt ervoor dat de Web Crawler altijd toegang heeft tot de nieuwste versie van je site.
Voeg geen geblokkeerde URLs toe
Zorg ervoor dat je sitemap geen URLs bevat die worden geblokkeerd door robots.txt of een “noindex”-tag hebben. Deze pagina’s zullen niet worden gecrawld, wat kan leiden tot een onvolledige kennisbasis voor je chatbot.
Hoe maak je een sitemap
Het maken van een sitemap is relatief eenvoudig, en er zijn verschillende tools beschikbaar die je hierbij kunnen helpen. Hier zijn een paar opties:
- CMS-plugins: Veel contentmanagementsystemen (CMS) zoals WordPress hebben plugins (bijv. Yoast SEO, All in One SEO) die automatisch een XML-sitemap voor je site genereren.
- Online tools: Je kunt ook gratis online sitemapgeneratoren gebruiken, zoals XML-sitemaps.com, om snel een sitemap te maken.
- Handmatig aanmaken: Als je handig bent met code, kun je handmatig een aangepaste XML-sitemap maken. Voor gedetailleerde instructies, zie Google’s officiële gids over sitemaps.
Zodra je sitemap klaar is, kun je deze uploaden naar de Web Crawler in Pulse voor de beste resultaten voor jouw crawl van de inhoud op je website.
Lees hier hoe je de Web Crawler instelt en gebruikt in dit artikel.