XML サイトマップ
検索エンジンのクローラーに、サイト内の全ページ URL を伝える XML 形式のファイル(sitemap.xml)。URL の一覧と、各 URL の最終更新日(lastmod)・更新頻度(changefreq)・優先度(priority)を構造化して記述する。Search Console に送信して、インデックス促進に使う。サイトマップ([[sitemap]])の検索エンジン向け版。
本書のスタンス(Lesson 6-3)は「Search Console への登録漏れ・古い URL の残置は重大リスク領域」。リニューアルで URL を変えたが旧サイトマップが残っていて 404 大量発生、新ページが Search Console に登録されない、サブドメイン毎の sitemap.xml をまとめ忘れる、といった事故が頻発する。
運用実務:CMS や静的サイトジェネレータで自動生成(WordPress は Yoast / RankMath プラグイン)、URL 数が 50,000 を超える / ファイルサイズが 50MB を超える場合は分割、サブドメイン別の sitemap を統合する「サイトマップインデックス」を作成、lastmod は実際の更新日(全部「今日」だとクロール頻度がランダム化)、noindex ページを含めない、Search Console での登録 + 月次でエラー確認、robots.txt から参照させる。
落とし穴は、古いキャッシュのまま放置で新ページが登録されない、リニューアル後の旧 URL 残置で 404 大量発生、人間向けサイトマップ([[sitemap]] HTML 版)と混同して必要なものを作らない、サブドメイン毎の sitemap.xml をまとめ忘れ、lastmod を全ページ「今日」にする、noindex ページが入っていて Search Console エラー、サイトマップに canonical 違反の URL が混入。
言葉をよく利用する人
- SEO 担当者
- コーダー / フロントエンドエンジニア
- Web 担当者(発注側)
- ディレクター
- インフラエンジニア
会話上での使用例
新ページ追加後の Search Console 反映を待つ場面
-
Web 担当者
昨日新ページ公開したのに Search Console に反映されません
-
SEO 担当者
XML サイトマップ が古いままかも。CMS で自動生成されているか確認しましょう。手動で URL 検査 → 「インデックス登録をリクエスト」もしておきます
リニューアル前にサイトマップを業者に確認する場面
-
Web 担当者
公開前に XML サイトマップ を最終確認したいです。旧サイトの URL が残ってないか、新規 URL が全件入っているかをチェック
-
業者ディレクター
了解です。リダイレクト対象の旧 URL は sitemap.xmlから除外、新 URL は全件含めて生成し直します。lastmod は実際の更新日を入れます