WinActor

更新 2021.02.02
サンプルシナリオ 外部サービス連携
AI inside 株式会社の「DX Suite」をWeb API経由で利用し、ファイルアップロードとOCR結果取得を行うサンプルシナリオ

DX Suite のOCRへPDFファイルをアップロードしてOCR実行結果をダウンロードするサンプルシナリオとなります。

DX Suite のOCRを利用して書類に書かれた文字列をデータ化したいユーザ向けのサンプルシナリオです。
本サンプルシナリオを変更することで、Web API経由でDX Suite のOCRを実行する手順を自動化することが可能です。

本コンテンツをダウンロードする前にこちらの利用条件を必ずご確認いただき、内容に同意をしたうえでダウンロードしてください。 また、"コンテンツの利用条件"は下のボタンからダウンロードし、お手元で保管してください。

サンプルシナリオ概要

はじめに

WinActorのライブラリ等のWinActorモジュールを使用して、AI inside 株式会社のAI-OCRサービス「DX Suite」にWeb APIを介してPDFファイルをアップロードしてOCR実行結果のCSVファイルをダウンロードするサンプルシナリオ(以降、本サンプルシナリオ)について説明します。

本サンプルシナリオの概要

本サンプルシナリオは、以下の処理を行います。

  • DX Suite に読み取りを行うPDFファイルをアップロードします。
  • DX Suite のOCRを実行します。
  • OCR実行結果のCSVファイルをダウンロードします。

使用するWinActorモジュール

本サンプルシナリオでは、以下のWinActorモジュールを使用します。

  • ノード/アクション/指定時間待機
  • ノード/アクション/スクリプト実行
  • 02_エラー処理/エラー.ums7
  • 07_文字列操作/01_変換・整形/括弧書きの内側を取り出す.ums7
  • 07_文字列操作/03_連結/文字列の連結(4つ).ums7
  • 07_文字列操作/03_連結/文字列の連結(5つ).ums7
  • 98_構造データ関連/01_JSON/JSON変数 読み取り.ums7
  • 98_構造データ関連/01_JSON/JSON形式読み取り.ums7
  • 99_外部サービス連携/02_HTTP関連/HTTP.ums7

本サンプルシナリオの入力ファイル

PDFファイルを入力ファイルとします。
シナリオ内でDX Suite にアップロードし、OCR読み取りを行います。
入力ファイルの詳細は、入力ファイルの形式を参照してください。

本サンプルシナリオの想定レベル

本ドキュメントは、以下の技術レベルのユーザを対象としています。

  • DX Suite の使い方について理解している。

動作確認環境

本サンプルシナリオは以下の環境で確認しています。

  • Windows 11、WinActor 7.5.0

制約事項

  • 本サンプルシナリオを実行するためには、DX Suite にアクセスするためのインターネット環境が必要です。
  • 本サンプルシナリオおよびドキュメントは、DX Suite にログインできる状態を前提に記載されています。
  • 本サンプルシナリオは WinActor 7.1 より古いバージョンでは動作しません。

本サンプルシナリオの使い方

本サンプルシナリオの実施方法は以下の通りです。

Step1.DX Suite 事前設定

本サンプルシナリオではシナリオ実行前の手順としてDX Suite を操作する必要があります。

DX Suite へのログイン

DX Suite を開いてログインを行ってください。

25900_01_login.png

DX Suite ホーム画面

ドキュメントの読み取り範囲の設定

本サンプルシナリオではドキュメントの読み取り範囲を事前に設定する必要があります。
以下の手順で設定をしてください。(手順内に記載されている"注文書サンプル.pdf"は本サンプルシナリオに添付されています)

1. ホーム画面の[Intelligent OCR]ボタンを押下します。
2. [ワークフローの作成]ボタンを押下します。

25900_02_workflow_home.png

OCRワークフロー画面


3. カスタム設定の[読み取り範囲の指定]ボタンを押下します。

25900_03_create_workflow.png

ワークフロー作成画面


4. 帳票テンプレート指定で"注文書サンプル.pdf"を指定します。

25900_04_set_document.png

帳票テンプレート指定画面


5. 帳票定義画面が表示されるので、読み取り個所を指定していきます。画面左側の[範囲を追加]ツールを選択し、注文書の発注日を選択します。
6. 選択後、画面右側の読み取り範囲設定で、それぞれ以下を設定します。
  ・読取範囲タイトル:発注日
  ・読取範囲指定:日付

25900_05_select_date.png

発注日の範囲設定


7. 続けて、表データの設定を行います。画面左側の[範囲を分割]ツールを選択し、表の見出し以外を選択します。

25900_06_select_data_1.png

表データの分割範囲設定


8. 選択後、画面右側の読み取り範囲設定で、それぞれ以下を設定します。
  ・読取範囲タイトル:表データ
  ・分割設定:8行、7列
  ・分割後項目設定:全ての文字

25900_07_select_data_2.png

表データの分割数設定


9. 分割範囲を調整します。画面左側の「範囲を選択」ツールを選択し、表データを選択します。その後、列のサイズを実際のサイズに合わせて調節します。

25900_08_select_data_3.png

表データの分割サイズ設定


10. 帳票定義画面の右上にある[保存して閉じる]ボタンを押下します。
11. ワークフロー画面に戻るので、画面左側下部の「データ加工」を選択し、右側に表示された「設定画面へ」ボタンを押下します。

25900_09_workflow_next.png

ワークフロー画面


12. データ加工設定画面が表示されるので、画面中央の「CSV出力先設定」を設定します。 まず、読み取り項目「表データ」のCSVヘッダー名を「品名」にします。 次に、定義されていない列を順次追加します。「列を追加」ボタンを押して、以下の列をそれぞれ追加します。
  ・入数
  ・箱数
  ・数量
  ・単位
  ・単価
  ・金額

25900_10_add_row_settings.png

データ加工設定で列を追加


13. 続けて、加工設定を追加します。画面右側の「加工設定を追加」ボタンを押下し、加工設定を以下のように設定します。
  ・加工設定:表データへ変換
  ・入力列:B(表データ)
  ・指定列:1列目から順にB~H列を指定

25900_11_custom_data_1.png

出力列の追加


14. もう一度「加工設定を追加」ボタンを押下し、加工設定を以下のように設定します。
  ・加工設定:前行コピー
  ・入力列:A(発注日)

25900_12_custom_data_2.png

日付の前行コピー設定


15. 右上の「保存して閉じる」ボタンを押下し、ワークフロー画面に戻ります。
16. ワークフロー画面の右上「保存して閉じる」ボタンを押下し、ホーム画面に戻ります。
17. ホーム画面左側にある、今回作成したワークフローのメニューを開きます。

25900_13_select_workflow_menu.png

ワークフローIDの取得


18. ワークフローのメニュー下部にある「ワークフローID」をクリックし、コピーしたIDを保存しておきます。 シナリオ実行に必要になります。

Step2.入力ファイルをディレクトリに配置

任意のディレクトリに入力ファイルを配置します。
本サンプルシナリオには、サンプルのPDFファイル(注文書サンプル.pdf)が添付されています。 このファイルを使用して、入力を行います。

Step3.WinActorで本サンプルシナリオを読み込み

WinActorを起動し、本サンプルシナリオを読み込みます。

Step4.動作に必要な変数を設定

本サンプルシナリオを実行するために必要な値を、変数一覧で設定します。
本サンプルシナリオの実行にあたり、事前に設定が必要な変数は下記の通りです。

  • APIキー
    • DX Suite のAPIキーを指定します。
      APIキーはDX Suite のホーム画面右上の組織名をクリックし、[設定] - [APIキー] の設定から確認できます。
  • 読み取りファイルパス
    • 本サンプルシナリオの入力ファイルのファイルパスを指定します。
      例) C:\sample\注文書サンプル.pdf
  • 読み取り結果CSVファイルパス
    • OCR実行結果のファイルを出力するファイルパスを指定します。
      例) C:\sample\結果.csv
  • ワークフローId
    • ワークフローIDを指定します。
      ワークフローIdは先述の「ドキュメントの読み取り範囲の設定」の手順で取得できます。 あるいは、Intelligent OCR画面のいずれかのワークフローのメニュー画面から取得可能です。
  • URL社名部分
    • URLに表示されている社名部分を指定します。
      社名部分はDX Suite を開いている際のアドレスバーに表示されます。(https://社名.dx-suite.com/ConsoleWeb/Dx/Top)

25900_14_user_setting_variable.png

本サンプルシナリオ変数一覧の設定

Step5.WinActorで本サンプルシナリオを実行

本サンプルシナリオを実行します。
OCR実行結果がダウンロードされると、本サンプルは終了します。

Step6.サンプルシナリオ実行終了後の確認

OCR読み取り結果CSVファイルパス変数に設定したファイルにOCR実行結果が記載されていることを確認してください。

トラブルシューティング

本サンプルシナリオでは、HTTPリクエストを使用しています。
シナリオ実行中にエラーが表示される場合はお手数ですが、エラーに表示されているレスポンスステータスコードを確認してください。
また、Step 4. 動作に必要な変数を設定を再度確認してください。

サンプルシナリオ解説

本サンプルシナリオで使用している実装テクニックについて説明します。

入力ファイルの形式

本サンプルシナリオの入力ファイル(PDF)は以下の形式をとります。

25900_15_input_file.png

入力ファイルサンプル


入力ファイルを自作する場合の注意事項
読み取り範囲を設定したドキュメント(入力ファイルサンプル)に形式を合わせて作成してください。
また、自作した場合は読み取り箇所がずれてしまうことがあるため、OCR実行をして読み取り結果を確認してください。

変更履歴

版数 日付 修正内容
版数
1.0版
日付
2020/2/13
修正内容
初版
版数
1.1版
日付
2021/2/2
修正内容
DX Suite のアップデートに対応。(DX Suite 2020/12/22 リリース版で動作確認済。)
版数
1.2版
日付
2024/1/11
修正内容
・注意事項を削除
・ファイル名を「SS2002_10043_DXSuite_Operation_WebAPI_1.0.1.zip」に変更
版数
1.3版
日付
2024/12/10
修正内容
DX Suite のアップデートに対応。(DX Suite 2024/12/3 リリース版で動作確認済。)

本コンテンツをダウンロードする前にこちらの利用条件を必ずご確認いただき、内容に同意をしたうえでダウンロードしてください。 また、"コンテンツの利用条件"は下のボタンからダウンロードし、お手元で保管してください。

"外部サービス連携"に関連するその他のサンプルシナリオ

サンプルシナリオ一覧へ戻る
当サイトでは、お客さまに最適なユーザー体験をご提供するためにCookieを使用しています。当サイトをご利用いただくことにより、お客さまがCookieの使用に同意されたものとみなします。詳細は、「プライバシーポリシー」をご確認ください。