XMLサイトマップからURL一覧を抽出する方法
更新日: by Heysho

本記事では、Webサイトの全ページURLを効率的に抽出する方法を解説します。XMLサイトマップからのURL抽出は、サイト構造の把握やSEO対策において重要な作業です。
以下の3つの方法について詳しく見ていきます。
- Screaming Frog SEO Spiderを使った抽出
- GoogleスプレッドシートのIMPORTXML関数を使った抽出
- 無料ツールを活用した抽出
サイト構成によって最適な方法は異なりますが、一般的なサイトマップであれば2番目の方法で比較的簡単に抽出できます。WordPressで「Google XML Sitemap」プラグインを使用している場合は、1番目の方法が適しています。
Screaming Frog SEO Spiderを使った抽出方法
Screaming Frog SEO Spiderは様々なタイプのサイトマップに対応しているため、最も汎用性の高い方法です。
-
手順1: Modeを「List」に変更
クロール対象ページを手動で指定します。
- 手順2: Upload → Download XML Sitemap をクリック
- 手順3: サイトマップのURLを入力してOKをクリック
-
手順4: All → HTML に変更して不要なファイルを除外
WordPressの「Google XML Sitemap」プラグイン使用時は、複数のXMLファイルが混在するため、HTMLファイルに絞り込みます。
-
手順5: 抽出完了
URLの一覧が表示されます。
GoogleスプレッドシートのIMPORTXML関数を使う方法
サイトマップにURLが直接リスト表示されている場合は、以下の関数で簡単に一括抽出できます。
=IMPORTXML(★サイトマップのURL★,"//*[local-name() ='url']/*[local-name() ='loc']")
「★サイトマップのURL★」の部分を実際のサイトマップURLに置き換えてください。
無料公開されているツールを使う方法
- XML Sitemap Extractor | rob hammond
- Google Sheet (Sitemap URL Extractor):
- Free XML Sitemap URL Extractor | SEOWL ※WordPressサイト対応
「XMLサイトマップ URL 抽出」などのキーワードでGoogle検索すると、他にも様々なツールが見つかります。
まとめ
上記の方法で解決しない場合は、お気軽にご質問ください。
最後までお読みいただきありがとうございました。テクニカルSEOに取り組み、Webサイトの改善に繋げていきましょう。