世界初・近代書籍対応の市販AI-OCRソフト「FROG AI-OCR」新機能追加
[23/09/27]
提供元:PRTIMES
提供元:PRTIMES
〜旧字旧仮名遣いから新字新仮名遣いへの変換機能〜
モルフォグループにおいてAIの事業化を担う、株式会社モルフォAIソリューションズ(所在地:東京都千代田区、代表取締役:神田武、以下 モルフォAIS)は、世界初(注1)近代書籍対応のAI-OCR(注2)ソフトウェア「FROG AI-OCR」に、旧字旧仮名遣いから新字新仮名遣いへの変換機能(例:旧字体「來」→新字体「来」)を新たに追加し、2023年9月27日(水)よりリリースします。
[画像1: https://prtimes.jp/i/64140/82/resize/d64140-82-c0d58325741b0d46f7b4-0.png ]
モルフォAISは、令和3年度から国立国会図書館の委託事業として図書館向けAI-OCR(NDLOCR)の開発に従事してきました。特徴としては、既存のOCRでは読み取りが不可であった、近代書籍の旧字旧仮名や複雑なレイアウトへの対応、既存OCRの2倍以上の読み取り精度(注3)を達成いたしました。開発したAI-OCRプログラムは、NDLOCRとして国立国会図書館がCC BY 4.0ライセンスで公開しています。(注4)
この度、図書館向けAI-OCR(NDLOCR)を活用した市販ソフト「FROG AI-OCR」(2022年7月1日発売)に新機能を追加しました。
新機能について
■旧字旧仮名遣いから新字新仮名遣いへの変換機能
今回のアップデートにて、「旧字旧仮名遣い」から「新字新仮名遣い」への変換をすることができるようになりました。例えば、旧字体である「來」を新字体の「来」に変換することができます。
この変換機能を利用することで、旧字旧仮名遣いが読めない方でも、当時の書籍や雑誌を新字新仮名遣いで翻訳や検索することができ、研究や教育の分野でもより幅広い方に活用いただくことが可能となります。
例えば、透明テキスト付PDFで新字新仮名文字を重ね合わせることで、過去の歴史的資料の検索性が圧倒的に高まると考えております。
[画像2: https://prtimes.jp/i/64140/82/resize/d64140-82-4e87d7bbd6446d7cc3e3-0.png ]
FROG AI-OCR製品ページ
https://frog-ai-ocr.morphoai.com/
FROG AI-OCR紹介ムービー
[動画: https://www.youtube.com/watch?v=MxAAHdQka4I ]
お申込み・問い合わせ窓口
https://www.morphoai.com/ai-ocr
こちらより無償トライアル頂く事が可能です
新機能版リリース日
2023年9月27日(水)
NDLOCRの特徴
1.複雑なレイアウトへの対応
[画像3: https://prtimes.jp/i/64140/82/resize/d64140-82-17a92fab192d0619988d-2.png ]
2.多様な文字種(旧字旧仮名)への対応
[画像4: https://prtimes.jp/i/64140/82/resize/d64140-82-2bfc0cbcafd7feeac4fa-3.png ]
3.OCR処理プログラムの精度向上
1860年代以降の書籍・雑誌において市販OCRより高い90%以上の精度で判定可能となりました。(注5)特に明治期〜昭和初期の近代書籍・雑誌においては、市販OCRより約2倍(約40%→90%以上)の読み取り精度となりました。
[画像5: https://prtimes.jp/i/64140/82/resize/d64140-82-28ccc1935519a644fc43-4.png ]
4.透明テキスト付PDF出力機能
テキストファイルでの出力に加え、透明テキスト付PDFでの出力も可能です。こちらにより、出力したPDF内でテキスト検索などを行うことが可能です。
[画像6: https://prtimes.jp/i/64140/82/resize/d64140-82-4f42b51a074cd1341553-5.png ]
注釈
(注1)弊社調べ(2022年6月)、明治〜昭和初期の書籍(文系・理系)及び雑誌の認識精度90%以上を保有する市販のAI-OCR製品が対象
(注2)OCR(Optical Character Recognition)光学式文字認識
(注3)令和3年度OCR処理プログラムの研究開発リリース参照:https://www.morphoinc.com/news/20220428-jpr-mais_ndl
(注4)NDLOCRのアプリケーション(GitHub上で公開):https://github.com/ndl-lab/ndlocr_cli
(注5)国立国会図書館 NDLラボ「令和3年度OCR処理プログラム研究開発」:https://lab.ndl.go.jp/data_set/ocr/r3_morpho/
関連プレスリリース
2022年4月28日
モルフォAIソリューションズが、国立国会図書館の最新AI技術を活用したOCR処理プログラムの開発を完了
https://www.morphoinc.com/news/20220428-jpr-mais_ndl
2022年5月9日
モルフォAIソリューションズが、国立国会図書館から視覚障害者等用のOCR開発を受託
https://www.morphoinc.com/news/20220509-jpr-mais_ndl
2022年6月14日
世界初、近代書籍対応の市販AI-OCRソフト「FROG AI-OCR」新発売
https://www.morphoinc.com/news/20220614-jpr-mais_frog_aiocr
2023年3月27日
世界初、近代書籍対応の市販AI-OCRソフト「FROG AI-OCR」新機能追加
〜透明テキスト付PDF出力機能・多段組対応機能〜
https://www.morphoinc.com/news/20230327-jpr-mais_frog_aiocr
株式会社モルフォAIソリューションズについて
モルフォAIソリューションズは、AI(人工知能)の事業化に取り組む企業です。行政、電力、交通、製造といった社会インフラの領域で、AI-OCRをはじめとする最先端のAI技術の導入と実運用を推進しております。
所在地:東京都千代田区神田錦町 2-2-1 KANDA SQUARE 11階 WeWork内
代表者:代表取締役 神田 武
設立:2019年12月
事業内容:AIコンサルティング、システムインテグレーション、SW・HW販売など
ホームページ:https://www.morphoai.com
株式会社モルフォについて
モルフォは「画像処理/AI(人工知能)」の研究開発型企業です。高度な画像処理技術を組み込みソフトウェアとして、国内外のスマートフォン、半導体メーカを中心にグローバルに展開しています。また、カメラで捉えた画像情報をエッジデバイスやクラウドで解析する、AIを駆使した画像認識技術を車載や産業IoT分野へ提供し、様々なイノベーションを先進のイメージング・テクノロジーで実現しています。
所在地:東京都千代田区神田錦町 2-2-1 KANDA SQUARE 11階WeWork内
代表者:代表取締役社長 平賀 督基(まさき)、【博士(理学)】
設立:2004年5月26日
資本金:1,783,958千円(2022年10月31日現在)
事業内容:画像処理およびAI(人工知能)技術の研究・製品開発。スマートフォン・半導体・車載・産業IoT向けソフトウェア事業をグローバルに展開。
ホームページ:https://www.morphoinc.com/
Facebook:https://www.facebook.com/morphoinc
X(旧Twitter):https://twitter.com/morpho_inc
お問合せ先
株式会社モルフォ 広報担当 大野
TEL:080-8433-3415
お問い合わせフォーム: http://www.morphoinc.com/contact
*モルフォ、Morphoおよびモルフォロゴは株式会社モルフォの登録商標または商標です。
モルフォグループにおいてAIの事業化を担う、株式会社モルフォAIソリューションズ(所在地:東京都千代田区、代表取締役:神田武、以下 モルフォAIS)は、世界初(注1)近代書籍対応のAI-OCR(注2)ソフトウェア「FROG AI-OCR」に、旧字旧仮名遣いから新字新仮名遣いへの変換機能(例:旧字体「來」→新字体「来」)を新たに追加し、2023年9月27日(水)よりリリースします。
[画像1: https://prtimes.jp/i/64140/82/resize/d64140-82-c0d58325741b0d46f7b4-0.png ]
モルフォAISは、令和3年度から国立国会図書館の委託事業として図書館向けAI-OCR(NDLOCR)の開発に従事してきました。特徴としては、既存のOCRでは読み取りが不可であった、近代書籍の旧字旧仮名や複雑なレイアウトへの対応、既存OCRの2倍以上の読み取り精度(注3)を達成いたしました。開発したAI-OCRプログラムは、NDLOCRとして国立国会図書館がCC BY 4.0ライセンスで公開しています。(注4)
この度、図書館向けAI-OCR(NDLOCR)を活用した市販ソフト「FROG AI-OCR」(2022年7月1日発売)に新機能を追加しました。
新機能について
■旧字旧仮名遣いから新字新仮名遣いへの変換機能
今回のアップデートにて、「旧字旧仮名遣い」から「新字新仮名遣い」への変換をすることができるようになりました。例えば、旧字体である「來」を新字体の「来」に変換することができます。
この変換機能を利用することで、旧字旧仮名遣いが読めない方でも、当時の書籍や雑誌を新字新仮名遣いで翻訳や検索することができ、研究や教育の分野でもより幅広い方に活用いただくことが可能となります。
例えば、透明テキスト付PDFで新字新仮名文字を重ね合わせることで、過去の歴史的資料の検索性が圧倒的に高まると考えております。
[画像2: https://prtimes.jp/i/64140/82/resize/d64140-82-4e87d7bbd6446d7cc3e3-0.png ]
FROG AI-OCR製品ページ
https://frog-ai-ocr.morphoai.com/
FROG AI-OCR紹介ムービー
[動画: https://www.youtube.com/watch?v=MxAAHdQka4I ]
お申込み・問い合わせ窓口
https://www.morphoai.com/ai-ocr
こちらより無償トライアル頂く事が可能です
新機能版リリース日
2023年9月27日(水)
NDLOCRの特徴
1.複雑なレイアウトへの対応
[画像3: https://prtimes.jp/i/64140/82/resize/d64140-82-17a92fab192d0619988d-2.png ]
2.多様な文字種(旧字旧仮名)への対応
[画像4: https://prtimes.jp/i/64140/82/resize/d64140-82-2bfc0cbcafd7feeac4fa-3.png ]
3.OCR処理プログラムの精度向上
1860年代以降の書籍・雑誌において市販OCRより高い90%以上の精度で判定可能となりました。(注5)特に明治期〜昭和初期の近代書籍・雑誌においては、市販OCRより約2倍(約40%→90%以上)の読み取り精度となりました。
[画像5: https://prtimes.jp/i/64140/82/resize/d64140-82-28ccc1935519a644fc43-4.png ]
4.透明テキスト付PDF出力機能
テキストファイルでの出力に加え、透明テキスト付PDFでの出力も可能です。こちらにより、出力したPDF内でテキスト検索などを行うことが可能です。
[画像6: https://prtimes.jp/i/64140/82/resize/d64140-82-4f42b51a074cd1341553-5.png ]
注釈
(注1)弊社調べ(2022年6月)、明治〜昭和初期の書籍(文系・理系)及び雑誌の認識精度90%以上を保有する市販のAI-OCR製品が対象
(注2)OCR(Optical Character Recognition)光学式文字認識
(注3)令和3年度OCR処理プログラムの研究開発リリース参照:https://www.morphoinc.com/news/20220428-jpr-mais_ndl
(注4)NDLOCRのアプリケーション(GitHub上で公開):https://github.com/ndl-lab/ndlocr_cli
(注5)国立国会図書館 NDLラボ「令和3年度OCR処理プログラム研究開発」:https://lab.ndl.go.jp/data_set/ocr/r3_morpho/
関連プレスリリース
2022年4月28日
モルフォAIソリューションズが、国立国会図書館の最新AI技術を活用したOCR処理プログラムの開発を完了
https://www.morphoinc.com/news/20220428-jpr-mais_ndl
2022年5月9日
モルフォAIソリューションズが、国立国会図書館から視覚障害者等用のOCR開発を受託
https://www.morphoinc.com/news/20220509-jpr-mais_ndl
2022年6月14日
世界初、近代書籍対応の市販AI-OCRソフト「FROG AI-OCR」新発売
https://www.morphoinc.com/news/20220614-jpr-mais_frog_aiocr
2023年3月27日
世界初、近代書籍対応の市販AI-OCRソフト「FROG AI-OCR」新機能追加
〜透明テキスト付PDF出力機能・多段組対応機能〜
https://www.morphoinc.com/news/20230327-jpr-mais_frog_aiocr
株式会社モルフォAIソリューションズについて
モルフォAIソリューションズは、AI(人工知能)の事業化に取り組む企業です。行政、電力、交通、製造といった社会インフラの領域で、AI-OCRをはじめとする最先端のAI技術の導入と実運用を推進しております。
所在地:東京都千代田区神田錦町 2-2-1 KANDA SQUARE 11階 WeWork内
代表者:代表取締役 神田 武
設立:2019年12月
事業内容:AIコンサルティング、システムインテグレーション、SW・HW販売など
ホームページ:https://www.morphoai.com
株式会社モルフォについて
モルフォは「画像処理/AI(人工知能)」の研究開発型企業です。高度な画像処理技術を組み込みソフトウェアとして、国内外のスマートフォン、半導体メーカを中心にグローバルに展開しています。また、カメラで捉えた画像情報をエッジデバイスやクラウドで解析する、AIを駆使した画像認識技術を車載や産業IoT分野へ提供し、様々なイノベーションを先進のイメージング・テクノロジーで実現しています。
所在地:東京都千代田区神田錦町 2-2-1 KANDA SQUARE 11階WeWork内
代表者:代表取締役社長 平賀 督基(まさき)、【博士(理学)】
設立:2004年5月26日
資本金:1,783,958千円(2022年10月31日現在)
事業内容:画像処理およびAI(人工知能)技術の研究・製品開発。スマートフォン・半導体・車載・産業IoT向けソフトウェア事業をグローバルに展開。
ホームページ:https://www.morphoinc.com/
Facebook:https://www.facebook.com/morphoinc
X(旧Twitter):https://twitter.com/morpho_inc
お問合せ先
株式会社モルフォ 広報担当 大野
TEL:080-8433-3415
お問い合わせフォーム: http://www.morphoinc.com/contact
*モルフォ、Morphoおよびモルフォロゴは株式会社モルフォの登録商標または商標です。