サイトマップが頻繁に変更される場合のウェブクローラーの使い方

ウェブクローラー を使ってウェブサイトのページを自動的に 対話AI の知識に追加していますか? その場合、サイトマップが定期的に変更されるときに、正しく対応する方法を知っておくことが重要です。

この記事では、サイトマップが変更された際に必要な対応と、対話AI が古い情報を利用しないようにする方法を説明します。

ウェブクローラー はサイトマップの変更を認識しない

ウェブサイトのサイトマップを変更しても、ウェブクローラー は以前のバージョンを記憶したり比較したりしません。
このツールは、追加されたサイトマップを毎回「新しい URL セット」として処理します。

変更されたサイトマップを再度追加した場合どうなるか?

  • サイトマップに含まれているすべての URL が、対話AI に再度追加されます。

  • サイトマップ上の URL が既にクロール済みの場合、その URL は 再クロールされるまで上書きされません

  • サイトマップから削除された URL は、自動的には 対話AI の知識から消えません。

変更されたサイトマップに対応する方法

  1. ウェブクローラー から、不要になった既存の URL を手動で削除します。

  2. 新しい(変更済みの)サイトマップを追加します。

  3. 必要なページを再度クロールします。

注意: この作業中は、対話AI が一時的にウェブクローラー からの知識を保持しない期間があります。アクセスが少ない時間帯に行うことをおすすめします。

詳しく知りたいですか?

ウェブクローラー の設定と使用方法については、こちらの記事をご覧ください:
👉 「ウェブクローラー の使い方」