ファーストアカウンティング、MIRU2023にて拡散モデルを用いたシーンテキスト認識に関する研究を発表
[23/12/08]
提供元:PRTIMES
提供元:PRTIMES
2023年7月25日〜7月28日にアクトシティ浜松にて開催されたMIRU2023にて、当社共同創業者兼チーフ・リサーチ・サイエンティスト(CRS)の藤武将人 博士が「拡散モデルを用いたシーンテキスト認識」で一般論文発表を行いました。
[画像: https://prtimes.jp/i/61842/85/resize/d61842-85-1177bdf9da218ac39497-0.jpg ]
画像の認識・理解シンポジウム「MIRU」は、画像の認識と理解技術に関する国内最大規模の会議です。大学や産業を問わず、研究者、技術者、そして次世代を担う学生の議論・交流の場であり、基礎から応用まで最新の研究発表と討論の場です。
■発表概要〜拡散モデルを利用した初の文字認識方法〜
今回の発表は、画像処理技術の国際会議IEEE ICIP2023にも採択されたもので、世界でも注目されている拡散モデルによるシーンテキスト認識を実現したものです。
写真などの情景画像からの文字情報(シーンテキスト)を認識するには、さまざまなフォント、さまざまな色、さまざまな形状の文字情報をテキストとして認識する必要があります。従来より非常に多くの手法が提案されてきましたが、今回ファーストアカウンティングが提案したのは、これまでにはない新しい手法、生成モデルの1つである拡散モデルによるシーンテキスト認識です。
拡散モデル(ノイズ除去拡散確率モデル)とは、ノイズを加えた画像から元の画像を推測し、元の画像に近づけていくように学習するAI技術です。近年流行している画像生成AIなどでもこの技術が利用されており、非常に注目されています。
画像を生成する技術としては非常に有名な拡散モデルですが、当社の研究チームは、これを文字認識に応用する新しいアプローチを検討しました。
構造が複雑な従来の手法と比べシンプルな手法でありながら、多数のベンチマークにおいて既存の手法を上回る高い精度を達成し、新しい文字認識の有効性を示し、今回のMIRU2023のみならず他の国内学会においても、新しい研究の方向性のディスカッションを深めております。
■ファーストアカウンティングについて
ファーストアカウンティングは、AIの力を活用して経理業務の効率化と自動化を実現するための法人向けサービスを展開する企業です。
文字認識技術の向上においては、コンピュータービジョン分野のみならず生成AIやLLMをはじめとする最新技術を研究し、さまざまな学術会議で論文を発表。それらの研究成果を元にサービス開発を行い、多数の大企業のお客様や会計ベンダー様にご提供しています。
私たちのパーパスは「制約を取り払うことで、自信と勇気を与える」です。AI技術を活用してお客様の業務上のさまざまな制約を取り払い、より価値のある業務にフォーカスしていただけるよう力を尽くしてまいります。
社名 :ファーストアカウンティング株式会社(東証グロース:5588)
所在地:東京都港区浜松町1-6-15 VORT浜松町I 3階
設立 :2016年6月
代表 :代表取締役社長 森 啓太郎
URL :https://www.fastaccounting.jp/
■本件に関するお問い合わせ
ファーストアカウンティング株式会社
担当:広報担当
E-mail: press@fastaccounting.co.jp
すべての製品名および会社名は、それぞれの所有者の商標または登録商標です。
[画像: https://prtimes.jp/i/61842/85/resize/d61842-85-1177bdf9da218ac39497-0.jpg ]
画像の認識・理解シンポジウム「MIRU」は、画像の認識と理解技術に関する国内最大規模の会議です。大学や産業を問わず、研究者、技術者、そして次世代を担う学生の議論・交流の場であり、基礎から応用まで最新の研究発表と討論の場です。
■発表概要〜拡散モデルを利用した初の文字認識方法〜
今回の発表は、画像処理技術の国際会議IEEE ICIP2023にも採択されたもので、世界でも注目されている拡散モデルによるシーンテキスト認識を実現したものです。
写真などの情景画像からの文字情報(シーンテキスト)を認識するには、さまざまなフォント、さまざまな色、さまざまな形状の文字情報をテキストとして認識する必要があります。従来より非常に多くの手法が提案されてきましたが、今回ファーストアカウンティングが提案したのは、これまでにはない新しい手法、生成モデルの1つである拡散モデルによるシーンテキスト認識です。
拡散モデル(ノイズ除去拡散確率モデル)とは、ノイズを加えた画像から元の画像を推測し、元の画像に近づけていくように学習するAI技術です。近年流行している画像生成AIなどでもこの技術が利用されており、非常に注目されています。
画像を生成する技術としては非常に有名な拡散モデルですが、当社の研究チームは、これを文字認識に応用する新しいアプローチを検討しました。
構造が複雑な従来の手法と比べシンプルな手法でありながら、多数のベンチマークにおいて既存の手法を上回る高い精度を達成し、新しい文字認識の有効性を示し、今回のMIRU2023のみならず他の国内学会においても、新しい研究の方向性のディスカッションを深めております。
■ファーストアカウンティングについて
ファーストアカウンティングは、AIの力を活用して経理業務の効率化と自動化を実現するための法人向けサービスを展開する企業です。
文字認識技術の向上においては、コンピュータービジョン分野のみならず生成AIやLLMをはじめとする最新技術を研究し、さまざまな学術会議で論文を発表。それらの研究成果を元にサービス開発を行い、多数の大企業のお客様や会計ベンダー様にご提供しています。
私たちのパーパスは「制約を取り払うことで、自信と勇気を与える」です。AI技術を活用してお客様の業務上のさまざまな制約を取り払い、より価値のある業務にフォーカスしていただけるよう力を尽くしてまいります。
社名 :ファーストアカウンティング株式会社(東証グロース:5588)
所在地:東京都港区浜松町1-6-15 VORT浜松町I 3階
設立 :2016年6月
代表 :代表取締役社長 森 啓太郎
URL :https://www.fastaccounting.jp/
■本件に関するお問い合わせ
ファーストアカウンティング株式会社
担当:広報担当
E-mail: press@fastaccounting.co.jp
すべての製品名および会社名は、それぞれの所有者の商標または登録商標です。