更新 2020.02.13
サンプルシナリオ外部サービス連携

AI inside 株式会社の「DX Suite」をChromeブラウザで利用し、ファイルアップロードとOCR結果取得を行うサンプルシナリオ

DX Suite のOCRへPDFファイルをアップロードしてOCR実行結果をダウンロードするサンプルシナリオとなります。

DX Suite のOCRを利用して書類に書かれた文字列をデータ化したいユーザ向けのサンプルシナリオです。
本サンプルシナリオを変更することで、ブラウザ操作でDX Suite のOCRを実行する手順を自動化することが可能です。

本サンプルシナリオをダウンロードする前にこちらの注意事項を必ずご確認ください。

注意事項を確認しました

DOWNLOAD

ツイートするシェアする

サンプルシナリオ概要

はじめに

WinActorのライブラリ等のWinActorモジュールを使用して、AI inside 株式会社のAI-OCRサービス「DX Suite」にChromeブラウザでPDFファイルをアップロードしてOCR実行結果のCSVファイルをダウンロードするサンプルシナリオ（以降、本サンプルシナリオ）について説明します。

注意事項

本サンプルシナリオ利用時の注意事項はこちらです。

本サンプルシナリオの概要

本サンプルシナリオは、以下の処理を行います。

Chromeブラウザを起動してDX Suite にログインします。
DX Suite に読み取りを行うPDFファイルをアップロードします。
DX Suite のOCRを実行します。
OCR実行結果のCSVファイルをダウンロードします。

使用するWinActorモジュール

本サンプルシナリオでは、以下のWinActorモジュールを使用します。太字の項目は、サンプルシナリオの実現にあたって重要度が高いWinActorモジュールです。

ノード/アクション/指定時間待機
04_自動記録アクション/クリック(WIN32).ums6
04_自動記録アクション/文字列設定(WIN32).ums6
07_文字列操作/03_連結/文字列の連結（３つ）.ums6
11_ウィンドウ関連/画面サイズ、位置設定.ums6
23_ブラウザ関連/ウィンドウクローズ.ums6
23_ブラウザ関連/クリック.ums6
23_ブラウザ関連/ブラウザ起動(プロキシ設定).ums6
23_ブラウザ関連/ページ表示.ums6
23_ブラウザ関連/値の取得.ums6
23_ブラウザ関連/値の設定(入力再現).ums6
23_ブラウザ関連/値の設定.ums6
23_ブラウザ関連/有効無効状態取得.ums6

本サンプルシナリオの入力ファイル

PDFファイルを入力ファイルとします。
シナリオ内でDX Suite にアップロードし、OCR読み取りを行います。
入力ファイルの詳細は、入力ファイルの形式を参照してください。

本サンプルシナリオの想定レベル

本ドキュメントは、以下の技術レベルのユーザを対象としています。

DX Suite の使い方について理解している。

動作確認環境

本サンプルシナリオは以下の環境で確認しています。

Windows 10、WinActor 6.3.0、Google Chrome 84.0.4147.135
Windows 10、WinActor 7.1.0、Google Chrome 84.0.4147.135

制約事項

本サンプルシナリオを実行するためには、DX Suite にアクセスするためのインターネット環境が必要です。
本サンプルシナリオおよびドキュメントは、DX Suite にログインできる状態を前提に記載されています。
本サンプルシナリオおよびドキュメントは、Google Chromeが使用できる状態を前提に記載されています。
本サンプルシナリオは WinActor 6.3 より古いバージョンでは動作しません。

本サンプルシナリオの使い方

本サンプルシナリオの実施方法は以下の通りです。

Step1.DX Suite 事前設定

本サンプルシナリオではシナリオ実行前の手順としてDX Suite を操作する必要があります。

DX Suite へのログイン

DX Suite を開いてログインを行ってください。

DX Suite ホーム画面

ドキュメントの読み取り範囲の設定

本サンプルシナリオではドキュメントの読み取り範囲を事前に設定する必要があります。
以下の手順で設定をしてください。(手順内に記載されている"注文書サンプル.pdf"は本サンプルシナリオに添付されています。)

1. ホーム画面の[Intelligent OCR]ボタンを押下します。
2. Intelligent OCR画面のフォルダの[追加]ボタンを押下します。

Intelligent OCR画面

3. フォルダ作成画面のフォルダ名入力欄に「注文書」を入力します。　※任意の文字列で問題ありません。
4. フォルダ作成画面の[作成]ボタンを押下します。

フォルダ作成画面

5. IntelligentOCR画面のドキュメントの[追加]ボタンを押下します。(ボタン左の文字列(注文書)は先ほど追加したフォルダ名です。)
6. ドキュメント作成画面の[新しい画像から]を押下します。
7. ドキュメント作成画面下部に表示された[ファイルを選択]を押下します。
8. ファイル選択画面から"注文書サンプル.pdf"を選択します。
9. ドキュメント作成画面下部に表示されたドキュメント名入力欄に「注文書_01」を入力します。　※任意の文字列で問題ありません。
10. ドキュメント作成画面下部に表示された[ドキュメント設定へ進む]を押下します。

ドキュメント作成画面

11. ドキュメント設定画面左側のツールの[読取範囲の指定]を押下し、ドキュメント設定画面の画像の注文書と同じく読み取り範囲選択の指定をします。
　読み取り範囲は以下の項目に指定します。　※発注日以外の項目は行をまとめて設定してください。

発注日
品名
入数
箱数
数量
単位
単価
金額

ドキュメント設定画面

12. ドキュメント設定画面右側の読取範囲全てにCSV設定をします。
　　以下の表の値を設定してください。

CSV読み取り範囲設定

読取範囲設定ブロック

13. ドキュメント設定画面右側の読取範囲ブロック全てのワークフロー 1番に「OCR」を設定します。
14. ドキュメント設定画面右側の品名の読取範囲の[設定]ボタンを押下します。
15. 読取範囲の詳細画面の縦入力欄に行数「8」を入力します。
16. 読取範囲の詳細設定画面の[設定]ボタンを押下します。
17. 14～16までの手順を発注日以外の読取範囲ブロック全てに行います。

読取範囲の詳細設定画面

18. ドキュメント設定画面左側のツールの[データ加工設定]を押下します。
19. データ加工設定画面の右上部にある[追加]ボタンを押下します。
20. データ加工設定画面の中央に表示された設定ブロックのリンスコントロールから「前行コピー」を選択します。
21. データ加工設定画面の中央に表示された設定ブロックの入力列入力欄に「A(1)」を入力します。
22. データ加工設定画面の中央に表示された設定ブロックの出力列入力欄に「A(1)」を入力します。
23. データ加工設定画面の右上部にある[追加]ボタンを押下します。
24. データ加工設定画面の中央に表示された設定ブロックのリストコントロールから「読取範囲グループ行分割」を選択します。
25. データ加工設定画面の中央に表示された設定ブロックの入力列入力欄に「B(2)」を入力します。
26. データ加工設定画面の中央に表示された設定ブロックの出力列入力欄に「B(2)」を入力します。
27. 23～26の手順を発注日以外の読取範囲分行います。使用する列名は順に C(3), D(4), E(5), F(6), G(7), H(8)です。
28. データ加工設定画面下部の[確定]ボタンを押下します。

データ加工設定画面

29. ドキュメント設定画面右下部の[保存]ボタンを押下します。
30. ポップアップされた保存後の画面遷移先の[一覧画面へ戻る]を押下します。
31. Intelligent OCR画面の左上部の[ホームマーク]ボタンを押下します。

Step2.入力ファイルをディレクトリに配置

任意のディレクトリに入力ファイルを配置します。
本サンプルシナリオには、サンプルのPDFファイル(注文書サンプル.pdf)が添付されています。
このファイルを使用して、入力を行います。

Step3.WinActorで本サンプルシナリオを読み込み

WinActorを起動し、本サンプルシナリオを読み込みます。

Step4.動作に必要な変数を設定

本サンプルシナリオを実行するために必要な値を、変数一覧で設定します。
本サンプルシナリオの実行にあたり、事前に設定が必要な変数は下記の通りです。

プロキシID
- プロキシのIDを指定します。
  ※プロキシサーバを利用しない場合、空白を指定してください。

プロキシパスワード
- プロキシのパスワードを指定します。
  ※プロキシサーバを利用しない場合、空白を指定してください。

URL
- DX Suite のURLを指定します。

ログインID
- DX Suite のIDを指定します。

ログインパスワード
- URLに表示されている社名部分を指定します。
  社名部分はDX Suite を開いている際のアドレスバーに表示されます。(https://社名.dx-suite.com/ConsoleWeb/Dx/Top)

docsetId
- フォルダIDを指定します。
  docsetIdはIntelligent OCR画面のいずれかのフォルダを選択するとアドレスバーに表示されます。("docsetId=0000" の0000の部分)

documentId
- ドキュメントIDを指定します。
  documentIdはIntelligent OCR画面のいずれかのドキュメントを選択するとアドレスバーに表示されます。("documentId=0000" の0000の部分)

読み取りファイルパス
- 本サンプルシナリオの入力ファイルのファイルパスを指定します。
  例) C:\sample\注文書サンプル.pdf

ユニット名
- 任意のユニット名を指定します。

本サンプルシナリオ変数一覧の設定

Step5.WinActorで本サンプルシナリオを実行

本サンプルシナリオを実行します。
Chromeブラウザが閉じると、本サンプルは終了します。

Step6.サンプルシナリオ実行終了後の確認

Chromeブラウザに設定されているダウンロードディレクトリに、OCR実行結果のCSVファイル(ファイル名はOCR読み取りを行ったPDFファイル名と同名)が格納されていることを確認してください。

トラブルシューティング

本サンプルシナリオでは、指定秒数待機している箇所があります。
以下に、固定秒数待機不足により失敗する動作に対しての修正箇所を記載します。シナリオ内の対象ブロックにある待機プロパティの秒数を増やす対応をしてください。

エラー内容

シナリオ内の対象のブロック

エラー内容
読取ユニット追加ボタンがクリックできない。

シナリオ内の対象のブロック
読取ユニット追加クリックの1つ前の指定時間待機

エラー内容
読取ユニット名の入力ができない。

シナリオ内の対象のブロック
読取ユニット名入力の1つ前の指定時間待機

エラー内容
OCR実行結果がダウンロードされない。

シナリオ内の対象のブロック
ログアウトボタン表示の1つ前の指定時間待機

サンプルシナリオ解説

本サンプルシナリオで使用している実装テクニックについて説明します。

入力ファイルの形式

本サンプルシナリオの入力ファイル(PDF)は以下の形式をとります。

入力ファイルサンプル

入力ファイルを自作する場合の注意事項

読み取り範囲を設定したドキュメント(入力ファイルサンプル)に形式を合わせて作成してください。
また、自作した場合は読み取り箇所がずれてしまうことがあるため、OCR実行をして読み取り結果を確認してください。

変更履歴

版数

日付

修正内容

版数
1.0版

日付
2020/2/13

修正内容
初版

版数
1.1版

日付
2021/2/2

修正内容
DX Suite のアップデートに対応。（DX Suite 2020/12/22 リリース版で動作確認済。）

本サンプルシナリオをダウンロードする前にこちらの注意事項を必ずご確認ください。

注意事項を確認しました

DOWNLOAD

ツイートするシェアする

"外部サービス連携"に関連するその他のサンプルシナリオ

2020年12月15日

サンプルシナリオ

Excelから取得したデータをAccessのフォームに転記するサンプルシナリオ

カテゴリー

外部サービス連携

対応バージョン

・ums6、ums7

公開日 2020年11月30日

カテゴリー

外部サービス連携

対応バージョン

・ums6、ums7

Access操作関連ライブラリを使用して、Excelファイルからデータを取得し、Accessファイルのフォームにデータの転記を行うサンプルシナリオになり...

詳しくはこちら
2020年11月16日

サンプルシナリオ

Accessのフォームで値の取得と設定を行うサンプルシナリオ

カテゴリー

外部サービス連携

対応バージョン

・ums6、ums7

公開日 2020年11月16日

カテゴリー

外部サービス連携

対応バージョン

・ums6、ums7

Access操作関連ライブラリを使用して、Accessファイルのフォームに表示された値の取得や設定を行うサンプルシナリオになります。

詳しくはこちら
2020年08月28日

サンプルシナリオ

株式会社アジラの「ジジラ」をChromeブラウザで利用し、定型機能を使用したOCRへのファイルアップロードとOCR結果取得を行うサンプルシナリオ

カテゴリー

外部サービス連携

対応バージョン

・ums6、ums7

公開日 2020年08月28日

カテゴリー

外部サービス連携

対応バージョン

・ums6、ums7

ジジラの定型機能を使用したOCRへPDFファイルをアップロードしてOCR実行結果をダウンロードするサンプルシナリオとなります。

詳しくはこちら
2020年08月28日

サンプルシナリオ

株式会社アジラの「ジジラ」をChromeブラウザで利用し、非定型機能を使用したOCRへのファイルアップロードとOCR結果取得を行うサンプルシナリオ

カテゴリー

外部サービス連携

対応バージョン

・ums6、ums7

公開日 2020年08月28日

カテゴリー

外部サービス連携

対応バージョン

・ums6、ums7

ジジラの非定型機能を使用したOCRへPDFファイルをアップロードしてOCR実行結果をダウンロードするサンプルシナリオとなります。

詳しくはこちら

サンプルシナリオ一覧へ戻る

更新 2020.02.13 サンプルシナリオ 外部サービス連携 AI inside 株式会社の「DX Suite」をChromeブラウザで利用し、ファイルアップロードとOCR結果取得を行うサンプルシナリオ

DX Suite のOCRへPDFファイルをアップロードしてOCR実行結果をダウンロードするサンプルシナリオとなります。

DX Suite のOCRを利用して書類に書かれた文字列をデータ化したいユーザ向けのサンプルシナリオです。 本サンプルシナリオを変更することで、ブラウザ操作でDX Suite のOCRを実行する手順を自動化することが可能です。

サンプルシナリオ概要

はじめに

注意事項

本サンプルシナリオの概要

使用するWinActorモジュール

本サンプルシナリオの入力ファイル

本サンプルシナリオの想定レベル

動作確認環境

制約事項

本サンプルシナリオの使い方

Step1.DX Suite 事前設定

DX Suite へのログイン

ドキュメントの読み取り範囲の設定

Step2.入力ファイルをディレクトリに配置

Step3.WinActorで本サンプルシナリオを読み込み

Step4.動作に必要な変数を設定

Step5.WinActorで本サンプルシナリオを実行

Step6.サンプルシナリオ実行終了後の確認

トラブルシューティング

サンプルシナリオ解説

入力ファイルの形式

変更履歴

"外部サービス連携"に関連するその他のサンプルシナリオ

Excelから取得したデータをAccessのフォームに転記するサンプルシナリオ

Accessのフォームで値の取得と設定を行うサンプルシナリオ

株式会社アジラの「ジジラ」をChromeブラウザで利用し、定型機能を使用したOCRへのファイルアップロードとOCR結果取得を行うサンプルシナリオ

株式会社アジラの「ジジラ」をChromeブラウザで利用し、非定型機能を使用したOCRへのファイルアップロードとOCR結果取得を行うサンプルシナリオ

更新 2020.02.13
サンプルシナリオ外部サービス連携

AI inside 株式会社の「DX Suite」をChromeブラウザで利用し、ファイルアップロードとOCR結果取得を行うサンプルシナリオ

DX Suite のOCRを利用して書類に書かれた文字列をデータ化したいユーザ向けのサンプルシナリオです。
本サンプルシナリオを変更することで、ブラウザ操作でDX Suite のOCRを実行する手順を自動化することが可能です。