ISID、文書活用AIソリューション「TexAIntelligence」に独自の日本語学習済AIモデル「ISID-BERT」を搭載

近年、AI技術の進歩により、幅広いビジネス領域でのAI活用が進みつつある。中でも自然言語処理技術は、2018年10月にGoogleが発表したBERT等、 文章の意味や文脈理解に関する技術進化が活発で、大幅な精度向上に伴い、企業における実装も拡がっている。株式会社電通国際情報サービス(以下、ISID)は、文書活用AIソリューション「TexAIntelligence」に、Googleの自然言語処理アルゴリズム「BERT」を用いて独自に構築した日本語学習済AIモデル「ISID-BERT」を搭載し、2021年2月より提供を開始する。TexAIntelligenceは、蓄積された大量の文書の分類・要約・検索をAI技術により自動化するソリューションだ。今般、BERTを軽量化したアルゴリズム「A Lite BERT(ALBERT)」に、日本語データを事前学習させた独自のAIモデルであるISID-BERTを構築し、TexAIntelligenceに搭載した。さらに、1文書あたりの取り扱い可能な単語数を倍増させることで、分類するための解析対象を広げるという。その結果、TexAIntelligenceの1機能である文書をカテゴリに分類する機能において、ISIDの検証用文書では、以前82%だった精度を、ISID-BERT搭載モデルでは95%まで向上することができた。ISID-BERT搭載版のTexAIntelligenceを活用することで、ユーザー自身で、自然言語処理を行うAIモデルを構築し、運用することが可能だ。

© 株式会社アールジーン