ふきげん猫ちび
Webサイトの全ページのURLの一覧をExcelにエクスポートしたい。
サイトマップからサイト上のすべてのページのURLを一括で抽出したい。
ふきげん猫ちび
ふきげん猫ちび
Google Sitemap XMLというプラグインでXMLサイトマップを使っているので、抽出が難しい。
このような悩みを解決するために、今回はサイト上の全部ページのURLを抽出する方法を解説します。
- Screaming Frog SEO Spiderから抽出する方法
- GoogleスプレッドシートのIMPORTXMLの数式を使う方法
- 無料公開されているツールを使う
これは簡単なように見えて実はトリッキーで、会社のサイトなどで利用されている一般的なサイトマップだと2の方法で一瞬で抽出できます。
ただWordPressサイトで「Google XML Sitemap」を利用している方は、1でしか抽出できないのでご注意ください。
ヘイショー
それでは、行ってみましょう!
Screaming Frog SEO Spiderから抽出する方法
これはどんなサイトマップでも抽出できるので、一番おすすめの方法です。
手順1
Modeを「Spider」から「List」に変更する
これでクロールするページをマニュアルで指定できるようになります。
手順2
Upload → Download XML Sitemap をクリック
手順3
サイトマップのURLを入力してOKをクリック
手順4
All → HTML に変更して不要なファイルを除外
WordPressの「Google XML Sitemap」のプラグインを使っている人は複数のxmlファイルが含まれてしまうので、フィルタリングするためにファイルの種類をHTMLに限定します。
手順5
完成
これで綺麗に抽出できました。
GoogleスプレッドシートのIMPORTXMLの数式を使う方法
サイトマップ上に直下でURL一覧が表示されているサイトでは、この方法で一瞬で抽出ができます。
=IMPORTXML(★サイトマップのURL★,”//*[local-name() =’url’]/*[local-name() =’loc’]”)
ここの「★サイトマップのURL★」の箇所をサイトマップのURLに置き換えると、一瞬で全ページのURLが表示されます。
無料公開されているツールを使う
- XML Sitemap Extractor | rob hammond
- Here the Google Sheet that act as a sitemap url extractor:
- Free XML Sitemap URL Extractor | SEOWL ← WordPressサイトでも使えます
ヘイショー
Google検索で「Extract URL from xml sitemap」や「Import URL from xml sitemap」で調べるといろいろ出てくると思います。
まとめ
もしこれらの方法でも解決できなければ、コメントいただければと思います。
ご精読ありがとうございました。
ヘイショー
テクニカルSEO頑張っていきましょう!