ビジネスに使える無料Webツールを公開しました

XMLサイトマップからURL一覧を抽出する方法

ふきげん猫ちび

Webサイトの全ページのURLの一覧をExcelにエクスポートしたい。
サイトマップからサイト上のすべてのページのURLを一括で抽出したい。

ふきげん猫ちび

ふきげん猫ちび

Google Sitemap XMLというプラグインでXMLサイトマップを使っているので、抽出が難しい。

このような悩みを解決するために、今回はサイト上の全部ページのURLを抽出する方法を解説します。

  1. Screaming Frog SEO Spiderから抽出する方法
  2. GoogleスプレッドシートのIMPORTXMLの数式を使う方法
  3. 無料公開されているツールを使う

これは簡単なように見えて実はトリッキーで、会社のサイトなどで利用されている一般的なサイトマップだと2の方法で一瞬で抽出できます。

ただWordPressサイトで「Google XML Sitemap」を利用している方は、1でしか抽出できないのでご注意ください。

ヘイショー

それでは、行ってみましょう!

Screaming Frog SEO Spiderから抽出する方法

これはどんなサイトマップでも抽出できるので、一番おすすめの方法です。

手順1
Modeを「Spider」から「List」に変更する

これでクロールするページをマニュアルで指定できるようになります。

手順2
Upload → Download XML Sitemap をクリック

 

手順3
サイトマップのURLを入力してOKをクリック

手順4
All → HTML に変更して不要なファイルを除外

WordPressの「Google XML Sitemap」のプラグインを使っている人は複数のxmlファイルが含まれてしまうので、フィルタリングするためにファイルの種類をHTMLに限定します。

手順5
完成

これで綺麗に抽出できました。

GoogleスプレッドシートのIMPORTXMLの数式を使う方法

サイトマップ上に直下でURL一覧が表示されているサイトでは、この方法で一瞬で抽出ができます。

=IMPORTXML(★サイトマップのURL★,”//*[local-name() =’url’]/*[local-name() =’loc’]”)

ここの「★サイトマップのURL★」の箇所をサイトマップのURLに置き換えると、一瞬で全ページのURLが表示されます。

無料公開されているツールを使う

ヘイショー

Google検索で「Extract URL from xml sitemap」や「Import URL from xml sitemap」で調べるといろいろ出てくると思います。

まとめ

もしこれらの方法でも解決できなければ、コメントいただければと思います。

ご精読ありがとうございました。

ヘイショー

テクニカルSEO頑張っていきましょう!