AI inside 株式会社の「DX Suite」をChromeブラウザで利用し、ファイルアップロードとOCR結果取得を行うサンプルシナリオ | サンプルシナリオ | WinActor® | 業務効率を劇的にカイゼンできる純国産RPAツール

更新 2020.02.13
サンプルシナリオ 外部サービス連携
AI inside 株式会社の「DX Suite」をChromeブラウザで利用し、ファイルアップロードとOCR結果取得を行うサンプルシナリオ

本サンプルシナリオをダウンロードする前にこちらの注意事項を必ずご確認ください。

サンプルシナリオ概要

AI inside 株式会社の「DX Suite」をChromeブラウザで利用し、ファイルアップロードとOCR結果取得を行うサンプルシナリオ

AI inside 株式会社の「DX Suite」をChromeブラウザで利用し、ファイルアップロードとOCR結果取得を行うサンプルシナリオ

はじめに

WinActorのライブラリ等のWinActorモジュールを使用して、AI inside 株式会社のAI-OCRサービス「DX Suite」にChromeブラウザでPDFファイルをアップロードしてOCR実行結果のCSVファイルをダウンロードするサンプルシナリオについて説明します。

注意事項

本サンプルシナリオ利用時の注意事項はこちらです。

本サンプルシナリオの概要

本サンプルシナリオは、以下の処理を行います。

  • Chromeブラウザを起動してDX Suite にログインします。
  • DX Suite に読み取りを行うPDFファイルをアップロードします。
  • DX Suite のOCRを実行します。
  • OCR実行結果のCSVファイルをダウンロードします。

使用するWinActorモジュール

本サンプルシナリオでは、以下のWinActorモジュールを使用します。太字の項目は、サンプルシナリオの実現にあたって重要度が高いWinActorモジュールです。

  • ノード/アクション/指定時間待機
  • ノード/アクション/クリップボード
  • ノード/変数/変数値設定
  • 04_自動記録アクション/エミュレーション.ums6
  • 04_自動記録アクション/クリック(WIN32).ums6
  • 04_自動記録アクション/文字列設定(WIN32).ums6
  • 07_文字列操作/02_切り出し・分割/文字列を前後に分割.ums6
  • 11_ウィンドウ関連/画面サイズ、位置設定.ums6
  • 23_ブラウザ関連/ウィンドウクローズ.ums6
  • 23_ブラウザ関連/クリック.ums6
  • 23_ブラウザ関連/ブラウザ起動(プロキシ設定).ums6
  • 23_ブラウザ関連/ページ表示.ums6
  • 23_ブラウザ関連/値の設定.ums6
  • 23_ブラウザ関連/有効無効状態取得.ums6

本サンプルシナリオの入力ファイル

PDFファイルを入力ファイルとします。
シナリオ内でDX Suite にアップロードし、OCR読み取りを行います。
入力ファイルの詳細は、入力ファイルの形式を参照してください。

本サンプルシナリオの想定レベル

本ドキュメントは、以下の技術レベルのユーザを対象としています。

  • DX Suite の使い方について理解している。

動作確認環境

本サンプルシナリオは以下の環境で確認しています。

  • Windows 10
  • WinActor 6.0.0、WinActor 6.1.0
  • Google Chrome 79.0.3945.117

制約事項

  • 本サンプルシナリオを実行するためには、DX Suite にアクセスするためのインターネット環境が必要です。
  • 本サンプルシナリオおよびドキュメントは、DX Suite にログインできる状態を前提に記載されています。
  • 本サンプルシナリオおよびドキュメントは、Google Chromeが使用できる状態を前提に記載されています。
  • 本サンプルシナリオは WinActor 6.0または6.1で動作します。
    WinActor6.2では「値の設定」が本シナリオ上で正常に処理されない問題があるため、本公開版では動作対象外となります。

本サンプルシナリオの使い方

本サンプルシナリオの実施方法は以下の通りです。

Step 1. DX Suite 事前設定

本サンプルシナリオではシナリオ実行前の手順としてDX Suite を操作する必要があります。

DX Suite へのログイン

DX Suite を開いてログインを行ってください。

DX Suite ホーム画面
DX Suite ホーム画面

ドキュメントの読み取り範囲の設定

本サンプルシナリオではドキュメントの読み取り範囲を事前に設定する必要があります。
以下の手順で設定をしてください。(手順内に記載されている"注文書サンプル.pdf"は本サンプルシナリオに添付されています)

  1. ホーム画面の[Intelligent OCR]ボタンを押下します。
  2. Intelligent OCR画面のフォルダの[追加]ボタンを押下します。

    Intelligent OCR画面
    Intelligent OCR画面
  3. フォルダ作成画面のフォルダ名入力欄に「注文書」を入力します。 ※任意の文字列で問題ありません。
  4. フォルダ作成画面の[作成]ボタンを押下します。

    フォルダ作成画面
    フォルダ作成画面
  5. IntelligentOCR画面のドキュメントの[追加]ボタンを押下します。(ボタン左の文字列(注文書)は先ほど追加したフォルダ名です。)
  6. ドキュメント作成画面の[新しい画像から]を押下します。
  7. ドキュメント作成画面下部に表示された[ファイルを選択]を押下します。
  8. ファイル選択画面から"注文書サンプル.pdf"を選択します。
  9. ドキュメント作成画面下部に表示されたドキュメント名入力欄に「注文書_01」を入力します。 ※任意の文字列で問題ありません。
  10. ドキュメント作成画面下部に表示された[ドキュメント設定へ進む]を押下します。

    ドキュメント作成画面
    ドキュメント作成画面
  11. ドキュメント設定画面左側のツールの[読取範囲の指定]を押下し、ドキュメント設定画面の画像の注文書と同じく読み取り範囲選択の指定をします。

    読み取り範囲は以下の項目に指定します。 ※発注日以外の項目は行をまとめて設定してください。

    • 発注日
    • 品名
    • 入数
    • 箱数
    • 数量
    • 単位
    • 単価
    • 金額
    ドキュメント設定画面
    ドキュメント設定画面
  12. ドキュメント設定画面右側の読取範囲全てにCSV設定をします。

    以下の表の値を設定してください。

    読取範囲 CSVヘッダー名 CSV出力先カラム
    発注日 発注日付 A
    品名 商品名 B
    入数 入数 C
    箱数 箱数 D
    数量 数量 E
    単位 単位 F
    単価 単価 G
    金額 金額 H
    読取範囲設定ブロック
    読取範囲設定ブロック
  13. ドキュメント設定画面右側の読取範囲ブロック全てのワークフロー 1番に「OCR」を設定します。
  14. ドキュメント設定画面右側の品名の読取範囲の[設定]ボタンを押下します。
  15. 読取範囲の詳細画面の縦入力欄に行数「8」を入力します。
  16. 読取範囲の詳細設定画面の[設定]ボタンを押下します。
  17. 14~16までの手順を発注日以外の読取範囲ブロック全てに行います。

    読取範囲の詳細設定画面
    読取範囲の詳細設定画面
  18. ドキュメント設定画面左側のツールの[データ加工設定]を押下します。
  19. データ加工設定画面の右上部にある[追加]ボタンを押下します。
  20. データ加工設定画面の中央に表示された設定ブロックのリンスコントロールから「前行コピー」を選択します。
  21. データ加工設定画面の中央に表示された設定ブロックの入力列入力欄に「A(1)」を入力します。
  22. データ加工設定画面の中央に表示された設定ブロックの出力列入力欄に「A(1)」を入力します。
  23. データ加工設定画面の右上部にある[追加]ボタンを押下します。
  24. データ加工設定画面の中央に表示された設定ブロックのリストコントロールから「読取範囲グループ行分割」を選択します。
  25. データ加工設定画面の中央に表示された設定ブロックの入力列入力欄に「B(2)」を入力します。
  26. データ加工設定画面の中央に表示された設定ブロックの出力列入力欄に「B(2)」を入力します。
  27. 23~26の手順を発注日以外の読取範囲分行います。使用する列名は順に C(3), D(4), E(5), F(6), G(7), H(8)です。
  28. データ加工設定画面下部の[確定]ボタンを押下します。

    データ加工設定画面
    データ加工設定画面
  29. ドキュメント設定画面右下部の[保存]ボタンを押下します。
  30. ポップアップされた保存後の画面遷移先の[一覧画面へ戻る]を押下します。
  31. Intelligent OCR画面の左上部の[ホームマーク]ボタンを押下します。

Step 2. 入力ファイルをディレクトリに配置

任意のディレクトリに入力ファイルを配置します。
本サンプルシナリオには、サンプルのPDFファイル(注文書サンプル.pdf)が添付されています。
このファイルを使用して、入力を行います。

Step 3. WinActorで本サンプルシナリオを読み込み

WinActorを起動し、本サンプルシナリオを読み込みます。

Step 4. 動作に必要な変数を設定

本サンプルシナリオを実行するために必要な値を、変数一覧で設定します。
本サンプルシナリオの実行にあたり、事前に設定が必要な変数は下記の通りです。

  • プロキシID
    • プロキシのIDを指定します。
      ※プロキシサーバを利用しない場合、空白を指定してください。
  • プロキシパスワード
    • プロキシのパスワードを指定します。
      ※プロキシサーバを利用しない場合、空白を指定してください。
  • DX_SuiteURL
    • DX Suite のURLを指定します。
  • DX_SuiteログインID
    • DX Suite のIDを指定します。
  • DX_Suiteパスワード
    • DX Suite のパスワードを指定します。
  • docsetId
    • フォルダIDを指定します。
      docsetIdはIntelligent OCR画面のいずれかのフォルダを選択するとアドレスバーに表示されます。("docsetId=0000" の0000の部分)
  • documentId
    • ドキュメントIDを指定します。
      documentIdはIntelligent OCR画面のいずれかのドキュメントを選択するとアドレスバーに表示されます。("documentId=0000" の0000の部分)
  • PDFファイルパス
    • 本サンプルシナリオの入力ファイルのファイルパスを指定します。

      例) C:\sample\注文書サンプル.pdf

  • ユニット名
    • 任意のユニット名を指定します。

      本サンプルシナリオ変数一覧の設定
      本サンプルシナリオ変数一覧の設定

Step 5. WinActorで本サンプルシナリオを実行

本サンプルシナリオを実行します。
Chromeブラウザが閉じると、本サンプルは終了します。

Step 6. サンプルシナリオ実行終了後の確認

Chromeブラウザに設定されているダウンロードディレクトリに、OCR実行結果のCSVファイル(ファイル名はOCR読み取りを行ったPDFファイル名と同名)が格納されていることを確認してください。

トラブルシューティング

本サンプルシナリオでは、指定秒数待機している箇所があります。
以下に、固定秒数待機不足により失敗する動作に対しての修正箇所を記載します。シナリオ内の対象ブロックにある待機プロパティの秒数を増やす対応をしてください。

エラー内容 シナリオ内の対象のブロック
読取ユニット追加ボタンがクリックできない。 読取ユニット追加の1つ前の指定時間待機
読取ユニット名の入力ができない。 読取ユニット名入力の1つ前の指定時間待機
読取ユニットIdが取得できない。 URL取得

サンプルシナリオ解説

本サンプルシナリオで使用している実装テクニックについて説明します。

入力ファイルの形式

本サンプルシナリオの入力ファイル(PDF)は以下の形式をとります。

入力ファイルサンプル
入力ファイルサンプル

入力ファイルを自作する場合の注意事項

読み取り範囲を設定したドキュメント(入力ファイルサンプル)に形式を合わせて作成してください。
また、自作した場合は読み取り箇所がずれてしまうことがあるため、OCR実行をして読み取り結果を確認してください。

変更履歴

版数 日付 修正内容
1.0版 2020/02/13 初版

本サンプルシナリオをダウンロードする前にこちらの注意事項を必ずご確認ください。

"外部サービス連携"に関連するその他のサンプルシナリオ

サンプルシナリオ一覧へ戻る