NEW 更新 2021.12.24
スイートライブラリ ブラウザ関連
テーブルスクレイピング(2次元配列出力)

ブラウザに表示される表(TABLE要素)をスクレイピングして、結果を2次元配列に格納します。
スクレイピングした内容を一時保存するためのファイルを、TMP 環境変数で指定されているフォルダに日時分秒ミリ秒を名称に付加して作成し、2次元配列格納後に削除します。

(例)
TEMP_20211126111724535.csv

・ブラウザ上の表の値を配列に格納し、配列の値を別のシステムに出力したい場合などに利用できます。

・2つの表から値を取得し、値の比較などに利用できます。

本ライブラリをダウンロードする前にこちらの注意事項を必ずご確認ください。

スイートライブラリ概要

入力
【ブラウザ名】
「ブラウザ起動」で設定した【ブラウザ名】を指定してください。
表(TABLE要素)が無いWebページは指定しないでください。
指定した場合はエラーメッセージ「The element is not found」あるいは「操作対象の要素が見つかりませんでした」が表示され、ライブラリの処理が停止します。

【スクレイピング対象のXPath】
スクレイピングを行う表のXPathを指定してください。

【ページ遷移要素のXPath】
ページ遷移するためのリンクのXPathを指定してください。

【回数】
ページ遷移の最大回数を指定してください。
未設定の場合、ページ遷移を行いません。

【待機時間(秒)(任意)】
Webページの要素を検索する時間を指定してください。
未設定の場合、10秒となります。

【間隔(秒)(任意)】
ページ遷移をする間隔を指定してください。
未設定の場合、0秒となります。

【タイトル行】
未設定か第1行か第2行のいずれかを指定してください。
CSVファイルの1行目にタイトル行として出力する行を指定します。
未設定の場合は、CSVファイルの1行目にタイトル行を出力しません。
デフォルト値:指定なし

【開始行】
スクレイピングを開始する最初の行を、第1行か第2行のいずれかで指定してください。
デフォルト値:第1行

【終了行】
スクレイピングを開始する最後の行を、最終行か最終行から1行前のいずれかで指定してください。
デフォルト値:最終行

【開始列】
スクレイピングを開始する最初の列を、第1列と第2列のいずれかで指定してください。
デフォルト値:第1列

【終了列】
スクレイピングを開始する最後の列を、終了列|最終列と最終列から1列前のいずれかで指定してください。
デフォルト値:最終列

【配列名】
スクレイピングした結果を2次元配列に出力するための配列名を指定してください。

【配列値の囲み("値")】
配列内の値をダブルクォーテーションで囲むか囲まないを指定してください。
デフォルト値:囲む

【終了状態を格納する変数】
終了状態を格納する変数名を指定してください。
指定した変数に、スクレイピング結果を返します。
「0」の場合は、「正常」
「-1」の場合は、「ページ遷移要素が見つからない」
「-2」の場合は、「スクレイピングに失敗した」
「-3」の場合は、「ページ遷移に失敗した(タイムアウト)」

【実行回数を格納する変数】
実行回数を格納する変数名を指定してください。
指定した変数に、スクレイピングに成功した回数を返します。

【最後のURLを格納する変数】
最後のURLを格納する変数名を指定してください。
指定した変数に、スクレイピングに成功した最後のURLを返します。
動作確認環境
・WinActor7.3.1、Windows10、Chrome96.0.4664.110、Edge96.0.1054.62、FireFox95.0.2

変更履歴

版数日付修正内容
版数
1.0版
日付
2021/12/24
修正内容
初版

本ライブラリをダウンロードする前にこちらの注意事項を必ずご確認ください。

"ブラウザ関連"に関連するその他のスイートライブラリ

スイートライブラリ一覧へ戻る
このウェブサイトでは、お客様に最適なユーザー体験を向上するためにCookieを使用しています。
本サイトをご利用いただくことにより、お客様がCookieの使用に同意されたものとみなします。
弊社のCookieの使用に関する方針の詳細は、
「プライバシーポリシー」をご確認ください。