シナモンAI、電帳法とインボイス制度に対応した請求書汎用AI-OCR「Flax Scanner for SD 請求書汎用モデル」を11月6日より販売
[23/11/04]
提供元:PRTIMES
提供元:PRTIMES
読み取り精度93%*/ フォーマットの異なる請求書の27項目を自動読み取り
国内の大手企業へAI(人工知能)ソリューションを提供する株式会社シナモン(本社:東京都港区、代表取締役Co-CEO:平野未来/堀田創 以下、シナモンAI)は、取引先ごとにフォーマットが異なる非定型の請求書を、事前の座標定義なしで27項目を自動認識してテキストを抽出するオリジナルのAI-OCR「Flax Scanner for SD 請求書汎用モデル」を、2023年11月6日より販売します。
[画像1: https://prtimes.jp/i/28252/79/resize/d28252-79-04d6cdcdc42794847444-0.png ]
請求書のようなフォーマットが無数に存在する書類を読み取ることが可能なAI-OCRシステムの開発には、抽出項目の座標定義を必要としない高度なAI-OCRの技術(特徴量学習型*2)が必要となります。今回発表する特徴量学習型のAI-OCR「Flax Scanner for SD 請求書汎用モデル」は、請求書で一般的によく使用される27項目(※別紙参照)を自動で読み取ることができるほか、読み取り精度93%*1と高精度の読み取りを実現しています。
シナモンAIは、専用モデル構築までのコストと時間が不要で、スピーディに導入することができる、汎用性の高い高精度なAI-OCRにより、請求書処理業務の大幅な効率化を推進してまいります。
*1 いずれもシナモンAIテストデータ値
*2 特徴量学習型AI-OCRは、複数の帳票において項目ごとに共通する様々な特徴を学習することで項目を特定し、記載内容と項目を紐づけることができる技術です。何の帳票か、どこに何が書かれているのかを自動で判断するため、お客様での設定が不要です。そのため、多種多様なフォーマットの非定型帳票に強いAI-OCRと言えます。
開発の背景
電帳法とインボイス制度の導入により、請求書のデジタル化と電子送信がますます重要となっています。企業は対象となる文書を電子帳簿として保存し、データの正確性を保つことが義務づけられています。一方、経理の現場では毎月大量の請求書が様々なフォーマットで届き、その内容確認や手作業によるデータ入力に多大な手間と時間がかかっており、業務負担が増加し、請求書の処理業務の効率化や正確なデータ化のニーズが高まっています。
従来、AI-OCRを活用して請求書をデータ化するためには、フォーマットごとに読み取り箇所や項目を事前に設定する座標定義型が一般的でしたが、事前設定の工数が大きく、また取引先ごとにフォーマットが異なるため無数のテンプレートを作成する必要があることが課題でした。
シナモンAIはこれまで、顧客専用のAI-OCRモデルを開発することで請求書を含む非定型帳票の自動読み取りを可能とし、様々な企業に提供してまいりましたが、専用のAI-OCRモデルの開発にはコストがかかり、導入できる企業は限られていました。AI-OCRをより多くの企業に導入いただけるよう、これまでに培ったノウハウを生かし、「請求書汎用モデル」の開発に着手し、シナモンAIの高度なAI技術により、様々な請求書のフォーマットを読み取ることができる実用レベルの汎用AI-OCRが完成し、この度の発表へと至ります。
請求書汎用モデルの特徴
・テンプレート作成不要
フォーマットを問わず、請求書のどこに何が書いてあるかをAIが判断し、各項目を高精度で抽出し読み取ります。取引先、登録番号、取引年月日だけでなく、明細に含まれる品名、数量、単価など最大27項目の読み取りが可能で、読み取り結果はCSVファイルでの出力やAPIでの連携が可能です。
・高精度で読み取り可能
最大27項目を文字単位精度で平均92.99%*、項目別精度で平均86.17%*と高精度での読み取りを
実現しています。
*いずれもシナモンAIテストデータ値
・帳票分類機能
アップロードされた請求書やその他帳票を自動で分類することができるため、請求書以外の帳票への対応も可能です。分類後、シナモンAIが提供する最適なAI-OCRモデル(請求書汎用モデル、座標定義型モデル、個別カスタマイズモデルなど)を、AIが自動で判断し処理することが可能です。
<参考資料> 「Flax Scanner for SD 請求書汎用モデル」読み取り対象27項目
■読み取り精度(シナモンAIによるテストデータ値)
文字単位精度:平均92.99% / 項目別精度:平均86.17%
* それぞれの項目で最大5つ読み取りが可能です。
※(明細)と付いている項目は、表形式で読み取ります。
No. 読み取り項目名
1. 請求元会社名
2. 請求元組織名
3. 請求元電話番号
4. 請求元FAX番号
5. 請求元郵便番号
6. 請求元住所
7. 登録番号
8. 発行日
9. 納品日
10. 請求書番号
11. 書類番号
12. 支払日
13. 請求先会社名
14. 請求先組織名
15. 合計金額税抜
16. 消費税
17. 合計金額税込
18. 銀行名*
19. 支店名*
20. 口座種別*
21. 口座番号*
22. 口座名*
23. 品名(明細)
24. 数量(明細)
25. 単位(明細)
26. 単価(明細)
27. 金額(明細)
◇本件に関する企業からの問い合わせ先: https://go.cinnamon.ai/inquiry.html
[画像2: https://prtimes.jp/i/28252/79/resize/d28252-79-b3f42702c77ffe719f05-1.png ]
■シナモンAI概要
社 名:株式会社シナモン
URL:http://www.cinnamon.ai
所在地:東京都港区虎ノ門3-19-13 スピリットビル6階
設 立:2016年10月
代表者:代表取締役Co-CEO平野未来 / 堀田創
[事業内容]AIプロダクト事業、AIコンサルティング事業
シナモンAIは、「誰もが新しい未来を描こうと思える、創造あふれる世界を、AIと共に」をパーパスに、高度なビジネスAIソリューション実現のため、AIコンサルティングとAIプロダクトを提供しております。お客様が保有するナレッジからAI時代の新たな事業構造を創造し、飛躍的な成長を先導する変革のシェルパ(先導役)として、多数の国内大手企業への提供実績を有しています。人工知能研究開発機能をベトナム(ハノイ・ホーチミン)および台湾に構え、高度なAI人材を獲得・育成するエコシステムを構築し、AI-OCR「Flax Scanner」、自然言語処理エンジン「Aurora Clipper」、音声認識エンジン「Rossa Voice」など、非構造化データを幅広くカバーする技術力を蓄積しています。直近では、独自のAI時代の戦略デザイン「ハーベストループ」とお客様のパーパスをつなげ、デジタルトランスフォーメーションやAI活用の推進を支援しています。
国内の大手企業へAI(人工知能)ソリューションを提供する株式会社シナモン(本社:東京都港区、代表取締役Co-CEO:平野未来/堀田創 以下、シナモンAI)は、取引先ごとにフォーマットが異なる非定型の請求書を、事前の座標定義なしで27項目を自動認識してテキストを抽出するオリジナルのAI-OCR「Flax Scanner for SD 請求書汎用モデル」を、2023年11月6日より販売します。
[画像1: https://prtimes.jp/i/28252/79/resize/d28252-79-04d6cdcdc42794847444-0.png ]
請求書のようなフォーマットが無数に存在する書類を読み取ることが可能なAI-OCRシステムの開発には、抽出項目の座標定義を必要としない高度なAI-OCRの技術(特徴量学習型*2)が必要となります。今回発表する特徴量学習型のAI-OCR「Flax Scanner for SD 請求書汎用モデル」は、請求書で一般的によく使用される27項目(※別紙参照)を自動で読み取ることができるほか、読み取り精度93%*1と高精度の読み取りを実現しています。
シナモンAIは、専用モデル構築までのコストと時間が不要で、スピーディに導入することができる、汎用性の高い高精度なAI-OCRにより、請求書処理業務の大幅な効率化を推進してまいります。
*1 いずれもシナモンAIテストデータ値
*2 特徴量学習型AI-OCRは、複数の帳票において項目ごとに共通する様々な特徴を学習することで項目を特定し、記載内容と項目を紐づけることができる技術です。何の帳票か、どこに何が書かれているのかを自動で判断するため、お客様での設定が不要です。そのため、多種多様なフォーマットの非定型帳票に強いAI-OCRと言えます。
開発の背景
電帳法とインボイス制度の導入により、請求書のデジタル化と電子送信がますます重要となっています。企業は対象となる文書を電子帳簿として保存し、データの正確性を保つことが義務づけられています。一方、経理の現場では毎月大量の請求書が様々なフォーマットで届き、その内容確認や手作業によるデータ入力に多大な手間と時間がかかっており、業務負担が増加し、請求書の処理業務の効率化や正確なデータ化のニーズが高まっています。
従来、AI-OCRを活用して請求書をデータ化するためには、フォーマットごとに読み取り箇所や項目を事前に設定する座標定義型が一般的でしたが、事前設定の工数が大きく、また取引先ごとにフォーマットが異なるため無数のテンプレートを作成する必要があることが課題でした。
シナモンAIはこれまで、顧客専用のAI-OCRモデルを開発することで請求書を含む非定型帳票の自動読み取りを可能とし、様々な企業に提供してまいりましたが、専用のAI-OCRモデルの開発にはコストがかかり、導入できる企業は限られていました。AI-OCRをより多くの企業に導入いただけるよう、これまでに培ったノウハウを生かし、「請求書汎用モデル」の開発に着手し、シナモンAIの高度なAI技術により、様々な請求書のフォーマットを読み取ることができる実用レベルの汎用AI-OCRが完成し、この度の発表へと至ります。
請求書汎用モデルの特徴
・テンプレート作成不要
フォーマットを問わず、請求書のどこに何が書いてあるかをAIが判断し、各項目を高精度で抽出し読み取ります。取引先、登録番号、取引年月日だけでなく、明細に含まれる品名、数量、単価など最大27項目の読み取りが可能で、読み取り結果はCSVファイルでの出力やAPIでの連携が可能です。
・高精度で読み取り可能
最大27項目を文字単位精度で平均92.99%*、項目別精度で平均86.17%*と高精度での読み取りを
実現しています。
*いずれもシナモンAIテストデータ値
・帳票分類機能
アップロードされた請求書やその他帳票を自動で分類することができるため、請求書以外の帳票への対応も可能です。分類後、シナモンAIが提供する最適なAI-OCRモデル(請求書汎用モデル、座標定義型モデル、個別カスタマイズモデルなど)を、AIが自動で判断し処理することが可能です。
<参考資料> 「Flax Scanner for SD 請求書汎用モデル」読み取り対象27項目
■読み取り精度(シナモンAIによるテストデータ値)
文字単位精度:平均92.99% / 項目別精度:平均86.17%
* それぞれの項目で最大5つ読み取りが可能です。
※(明細)と付いている項目は、表形式で読み取ります。
No. 読み取り項目名
1. 請求元会社名
2. 請求元組織名
3. 請求元電話番号
4. 請求元FAX番号
5. 請求元郵便番号
6. 請求元住所
7. 登録番号
8. 発行日
9. 納品日
10. 請求書番号
11. 書類番号
12. 支払日
13. 請求先会社名
14. 請求先組織名
15. 合計金額税抜
16. 消費税
17. 合計金額税込
18. 銀行名*
19. 支店名*
20. 口座種別*
21. 口座番号*
22. 口座名*
23. 品名(明細)
24. 数量(明細)
25. 単位(明細)
26. 単価(明細)
27. 金額(明細)
◇本件に関する企業からの問い合わせ先: https://go.cinnamon.ai/inquiry.html
[画像2: https://prtimes.jp/i/28252/79/resize/d28252-79-b3f42702c77ffe719f05-1.png ]
■シナモンAI概要
社 名:株式会社シナモン
URL:http://www.cinnamon.ai
所在地:東京都港区虎ノ門3-19-13 スピリットビル6階
設 立:2016年10月
代表者:代表取締役Co-CEO平野未来 / 堀田創
[事業内容]AIプロダクト事業、AIコンサルティング事業
シナモンAIは、「誰もが新しい未来を描こうと思える、創造あふれる世界を、AIと共に」をパーパスに、高度なビジネスAIソリューション実現のため、AIコンサルティングとAIプロダクトを提供しております。お客様が保有するナレッジからAI時代の新たな事業構造を創造し、飛躍的な成長を先導する変革のシェルパ(先導役)として、多数の国内大手企業への提供実績を有しています。人工知能研究開発機能をベトナム(ハノイ・ホーチミン)および台湾に構え、高度なAI人材を獲得・育成するエコシステムを構築し、AI-OCR「Flax Scanner」、自然言語処理エンジン「Aurora Clipper」、音声認識エンジン「Rossa Voice」など、非構造化データを幅広くカバーする技術力を蓄積しています。直近では、独自のAI時代の戦略デザイン「ハーベストループ」とお客様のパーパスをつなげ、デジタルトランスフォーメーションやAI活用の推進を支援しています。