XMLサイトマップからURL一覧を抽出する方法

更新日: by Heysho

SEO対策とは?

本記事では、Webサイトの全ページURLを効率的に抽出する方法を解説します。XMLサイトマップからのURL抽出は、サイト構造の把握やSEO対策において重要な作業です。

以下の3つの方法について詳しく見ていきます。

  1. Screaming Frog SEO Spiderを使った抽出
  2. GoogleスプレッドシートのIMPORTXML関数を使った抽出
  3. 無料ツールを活用した抽出

サイト構成によって最適な方法は異なりますが、一般的なサイトマップであれば2番目の方法で比較的簡単に抽出できます。WordPressで「Google XML Sitemap」プラグインを使用している場合は、1番目の方法が適しています。

Screaming Frog SEO Spiderを使った抽出方法

Screaming Frog SEO Spiderは様々なタイプのサイトマップに対応しているため、最も汎用性の高い方法です。

  • 手順1: Modeを「List」に変更

    クロール対象ページを手動で指定します。

  • 手順2: Upload → Download XML Sitemap をクリック
  • 手順3: サイトマップのURLを入力してOKをクリック
  • 手順4: All → HTML に変更して不要なファイルを除外

    WordPressの「Google XML Sitemap」プラグイン使用時は、複数のXMLファイルが混在するため、HTMLファイルに絞り込みます。

  • 手順5: 抽出完了

    URLの一覧が表示されます。

GoogleスプレッドシートのIMPORTXML関数を使う方法

サイトマップにURLが直接リスト表示されている場合は、以下の関数で簡単に一括抽出できます。

=IMPORTXML(★サイトマップのURL★,"//*[local-name() ='url']/*[local-name() ='loc']")

「★サイトマップのURL★」の部分を実際のサイトマップURLに置き換えてください。

無料公開されているツールを使う方法

「XMLサイトマップ URL 抽出」などのキーワードでGoogle検索すると、他にも様々なツールが見つかります。

まとめ

上記の方法で解決しない場合は、お気軽にご質問ください。

最後までお読みいただきありがとうございました。テクニカルSEOに取り組み、Webサイトの改善に繋げていきましょう。