アジラ、AI-OCR向け非定型帳票モデルのフレームワーク「freeFormer」を開発

同種の帳票でもそのフォーマットが多様な「少量多品種」帳票に対応した「非定型OCR」システムは、SaaS型モデルのAI-OCRによる処理が主流になっている。請求書やレシートなど、データとして取得すべき項目と位置が共通している帳票がその対象だ。一方で、各企業間のクローズドな環境でのみ多く流通している独自フォーマットの発注書や、業界特有・独特の帳票類など一般的ではないが量が多い特殊な帳票に対しては、独自の非定型モデルの新たな構築が必要であり、その開発に長期間・高コストがかかることがデジタライゼーションのネックになっていた。株式会社アジラは、従来のAI-OCRでは対応が進まなかった特殊な非定型帳票に対応したフレームワーク 「freeFormer」の適用を開始した。freeFormerを適用した非定型帳票モデル開発では、ロジックを極力排した「AIモデルによる分類判断」を行うため、より柔軟な項目分類を可能とした。これにより、ロングテールとして扱われてきた特殊性が強い非定型帳票でも、ボリュームの多い他の非定型帳票開発と同等に扱うことができる。今までAI-OCRの導入に躊躇していた企業組織でも現実的な導入検討を進めやすくなり、入力業務等の改善につながる。freeFormerの項目分類AIは、自然言語処理と項目位置情報をもとに学習する独自のアルゴリズムを用いている。これにより、従来の非定型モデルよりも、人間が帳票を見た際に経る思考過程が再現されているという。freeFormerのアルゴリズムを発展させることで、契約書などの長文から特定の項目を抽出する等の処理も可能になるため、コロナ禍で重要性が高まっている働き方改革への貢献も期待できる。なお、アジラでは現在、一般的で利用頻度の高い特定帳票に関する共同開発パートナーを募集している。開発された非定型モデルはSaaS版AI-OCR「ジジラ」に組み込むとともに、パートナーへの低料金での提供や共同販売契約など先行投資メリットをシェアするとした。

© 株式会社アールジーン