項目設定のコツ

1.項目設定とは?

項目設定とは、AIに対して「書類のどこから、どんな情報を抜き出してほしいか」を教えるための「指示書」のようなものです。書類をアップロードすると、AIが書類を読み取り、項目を自動で出力してくれます。最初から全て手動も可能ですが、AIが読み取った項目を、自分で変更する方法がおすすめです。
 

2. データ型の種類と使い分け

 
項目ごとに適切な「データ型」を選択することで、出力されるデータの形式を統一できます。(※画像参照)
データ型内容おすすめの利用シーン
テキスト一般的なテキスト会社名、住所、品名など
日付日付形式のデータ発行日、締切日、納品日など
数字数値のみ(カンマ除去等)単価、数量、金額、消費税など
複数業データ表形式のデータ明細行(品名、単価、数量のセット)など

3. 読み取り精度を上げるための「項目名」のコツ

AIは項目名をヒントに場所を探します。曖昧な名前よりも、具体的な名前を付けるのがコツです。
  • 例: 「発行元電話番号」「請求先郵便番号」
    • (場所を特定しやすくなり、他の電話番号との混同を防げます)
  • 上手く読み取れない例: 「電話」「郵便番号」
    • (書類内に複数の「電話」や「郵便番号」がある場合、AIが迷ってしまうので、「どこの」があると出力されやすいです)
その他のコツ
  • 綺麗なデータであればAIが上手く判別するのですが、手書き帳票などの場合、出力内容のデータの種類を狭めると、上手く出力されないケースもあります。データの種類を「テキスト」にすると読み取る範囲が広がるため、上手くいかない場合は、お試しください。
 
  • 丸やチェックのみを出力させたい時
「項目名」に追加で(丸(もしくはチェック)されているもののみ出力)などを書き込むと上手く出力されやすいです。
例:追加オプション(丸されているもののみ出力)
 
 

4. 精度が下がりやすいケース

 
  • 1つの枠に複数の情報が含まれるもの:
    • AIは「1つの項目=1つの値」が得意です。一つの枠に複数の情報や入り組んだ表などは、精度が下がりやすいです。分割して読み取るか、「備考」として一括で読み取る設定にすると、少々精度が上がる可能性があります。
  • 文字が重なっている、または極端に薄い場合
画像自体のノイズが多いと精度が下がります。スキャンの設定を見直すことも一つのコツです。
  • 文字がかなり粗い場合
目視でも判別することが困難なものは、AIでも読み取れない可能性が高まります。

5. 書式の異なるデータを「整形」して出力するコツ

 
  • 「読み取り必須項目」を絞り込み、優先的に設定する
読取パターンの設定1つに対して、2枚以上の書式の異なる納品書等を読み取る場合、項目が漏れてしまう可能性が高まります。項目に優先度をつけて、AIに読み取ってほしいものを吟味しておくのもおすすめです。
また、あまりにも項目内容や名前が異なる場合は、読取パターンを別々に分けておくことをオススメします。
 
  • 共通の項目を用意する
  • Aは「出荷日」、Bは「納品日」と書いてあっても、出力したい項目名を「お届け日」として設定しておけば、AIがそれぞれの書類から該当する日付を探し出し、同じ列にまとめてくれます。上手く出力されない場合は、それぞれ「出荷日」・「納品日」と、事前に項目の設定しておくのも◎