ふきげん猫ちび
Power Automate DesktopでWebサイトの全ページのメタタイトル・メタディスクリプションを抽出したい。
Power Automate Desktopでどんな感じでスクレイピングのアプリを作るのか見てみたい。
ふきげん猫ちび
ふきげん猫ちび
GASやツールでスクレイピングしようとしたけど、Webサイトが機会による巡回をブロックしているから出来ない。
このようなニーズをお応えするために、本日はPower Automate Desktopを利用してWebサイトのメタタイトルとメタディスクリプションをスクレイピングする方法を公開します。
仕様はこんな感じです。
- Power Automate Desktopを利用
- メタタイトル、メタディスクリプションを取得
- 取得したデータをExcelに書き込む
ヘイショー
人間の挙動に近い動きをするので、機械によるクロールをブロックしているWebサイトにも使えます。
スクショを用いて丁寧に解説するので、同じ動作をすれば作れます。
ヘイショー
それでは、行ってみましょう!
目次
STEP 1. Excelの起動→保存を行う
詳細は以下の記事で解説しています。
関連記事 Power Automate Desktopでエクセルを起動&保存する方法
STEP 2. エクセルからURLを取得する
左のカラムから「Excelワークシートから最初の空の列や行を取得」をドラッグ&ドロップ。
何も設定せずに保存をクリック。
ヘイショー
このアクションは「エクセル内の空白のセルを参照する」というの意味です。詳しくは以下の記事を参照ください。
参考記事 Power Automate Desktop 「Excel ワークシートから最初の空の列や行を取得」アクション | 誰でもできる業務改善講座
参考記事 【超初心者向け】Power Automate DesktopでExcelワークシートからデータのある範囲を取得する方法 | いつも隣にITのお仕事
左のカラムから「Excelワークシートから読み取り」をドラッグ&ドロップ。
上記の通り設定ください。
ヘイショー
このアクションは「エクセル内のURLの値を取得する」というの役割を果たします。
STEP 3. ブラウザ起動→メタタイトル取得
STEP 4. 取得したデータをエクセルに書き込む
STEP 5.メタディスクリプション取得
STEP 6.メタディスクリプションをエクセルに書き込む
STEP 7.ブラウザを閉じる
STEP 8.参照するURLの行を移動させる
STEP 9.エラー発生時の対策をする
STEP 10.保存&動作テストを行う
これで問題なく動作すれば、終了です。
まとめ
長くなりましたが、こちらがPower Automate Desktopのスクレイピング方法の一つの例になります。
ヘイショー
ご精読ありがとうございました。