認識言語オプションの追加と外国言語の認識を強化した「活字文書OCRライブラリ v.9.5」の販売開始
[17/07/18]
提供元:DreamNews
提供元:DreamNews
株式会社エヌジェーケー(本社:東京都中央区、代表取締役社長:石川 勝雅)は、メディアドライブブランドとして認識言語オプション(タイ語・ベトナム語・マレー語・インドネシア語)の追加と既存の外国言語認識(英語・中国語・韓国語)を強化した「活字文書OCRライブラリ v.9.5」を7月18日より販売開始します。
「活字文書OCRライブラリ v.9.5」は、非定型の活字文書の画像に対して文字認識を行い、認識した文字コードを出力するDLL(ダイナミックリンクライブラリ)です。
本ライブラリを活用することで、お客様のアプリケーションや業務システムなどと連携し、高精度な認識結果をOffice文書や透明テキスト付きPDFなどのファイルフォーマットで出力できます。
本バージョンは、「活字文書OCRライブラリ v.9.0」をベースに、外国言語の認識改良および新機能を搭載し、外国言語の認識に特化したバージョンとしてリリースします。
これまで、既存のアプリケーションや業務システムに英語・中国語・韓国語以外の幅広い言語に対応したOCRライブラリを組み込むには、海外メーカー製のOCRライブラリが中心で、メーカー開発拠点が海外のため「円滑な連携が取れるか不安」、「日本語でのサポートに対応していない」など、海外メーカーとの取引ハードルの高さから、検討が滞ってしまうことも珍しくありませんでした。
本ライブラリは、国内で多数の実績があるOCR専門メーカーが開発、提供するOCRライブラリのため、個別要件のご相談からサポート体制まで、安心してご利用いただけます。
本バージョンの主な特長としては、新たに認識可能な言語として、ご要望が多かったアジア言語(タイ語・ベトナム語・マレー語・インドネシア語)を追加しました。
アジア諸国へ進出する企業や、現地企業・団体等とのつながりがあって、アジア言語の文書を多く取り扱う企業など、アジア言語認識のニーズにご対応いただけます。
また従来認識可能であった英語・中国語・韓国語では、精度向上はもちろん、英語と中国語/韓国語の混在文書にて、言語設定を行わずに高精度な認識が可能となりました。
プレスリリース詳細:https://www.njk.co.jp/latest/48-20170718/
◇発売日
2017年7月18日
◇価格
活字文書OCRライブラリ v.9.5 開発キット
定価 500,000円(税込 540,000円)
活字文書OCRライブラリ v.9.5 開発キット 年間保守サービス
定価 100,000円(108,000円)
活字文書OCRライブラリ v.9.5(Server OS 対応版) 開発キット
定価 750,000円(810,000円)
活字文書OCRライブラリ v.9.5(Server OS 対応版) 開発キット 年間保守サービス
定価 150,000円(162,000円)
【活字文書OCRライブラリ v.9.5 言語別認識オプション】
・タイ語認識オプション
・ベトナム語認識オプション
・マレー語認識オプション
・インドネシア語認識オプション
・欧米語認識オプション
※言語別認識オプションおよびライセンス(ロイヤリティー)価格については、当社営業担当へお問い合わせください。
※年間保守サービスは初年度必須となります。商品購入時にお申し込みください。
◇基本機能
1.日本語・英語・中国語・韓国語の認識が可能です。また日本語、英語は混在認識が可能です。
2.日本語は、JIS第1水準およびJIS第2水準全ての漢字の認識が可能です。
3.中国語は、簡体字および繁体字の認識が可能です。
4.縦書き、横書きの自動判別が可能です。
5.文字サイズ混在文書に対応可能です。
6.認識結果の文字数、外接する矩形座標、候補文字、信頼度データなどの様々な情報を取得可能です。
7.日本語/英語の斜体(イタリック)文字の認識が可能です。※1
8.日本語の縦書き中に横書きで挿入された英字の認識が可能です。
9.デジカメ画像(スマートフォンやデジタルカメラで撮影された画像)専用の認識エンジンを搭載。ピンボケした低品質の画像も高精度に認識できます。
10.つぶれ/かすれ文字で実績のある認識エンジンを搭載。写真モード(文字/写真モード)の設定で白黒スキャンしたカタログ等にみられる文字の劣化を補正して認識できます。※2
11. 欧米語認識オプション
欧米語認識オプション対応可能です。
<オプション標準対応言語>
ドイツ語・フランス語・スペイン語・イタリア語・オランダ語・スウェーデン語・ノルウェー語・フィンランド語・デンマーク語・ポルトガル語・ロシア語
※1日本語は行単位での処理となりますので、行中に標準と斜体の文字が混在している場合は認識精度が低下すること
があります。
※2本機能は日本語/中国語/韓国語の認識時のみ有効です。
◇主な新機能
1.アジア圏言語の一部を認識言語オプションとして追加
(1)タイ語
(2)ベトナム語
(3)マレー語
(4)インドネシア語
2.英語/中国語/韓国語の認識精度向上
(1)英語認識率向上
新英語認識エンジンを搭載し、認識精度が向上しました。
(2)中国語認識率向上
中国語と英語が混在する文書の認識処理が可能になりました。
(3)韓国語認識率向上
韓国語と英語が混在する文書の認識処理が可能になりました。
3.レイアウト解析精度向上
外国言語のレイアウト解析精度が向上しました。
4.マルチプロセス対応
マルチプロセスに対応し、サーバー利用時の処理効率向上が可能になりました。
◇スペック
【認識言語】
●標準:日本語/英語/中国語(簡体・繁体)/韓国語
●オプション:タイ語/ベトナム語/マレー語/インドネシア語/欧米語
※欧米語
ドイツ語・フランス語・スペイン語・イタリア語・オランダ語・スウェーデン語・
ノルウェー語・フィンランド語・デンマーク語・ポルトガル語・ロシア語
【認識書体】
●日本語認識:明朝体・ゴシック体・教科書体等マルチフォント対応
●英語認識 :マルチフォント対応
●中国語/韓国語認識:明朝体・ゴシック体など10種類以上のフォントに対応
●タイ語・ベトナム語・マレー語・インドネシア語認識:マルチフォント対応
【入力ファイル形式】
BMP、JPEG、PNG、PDF(画像のみ)
TIFF(マルチ/シングルページ、非圧縮、G3/G4圧縮、LZW圧縮)
メモリ上の画像データ(DIB形式)
【解像度/画像サイズ】
●スキャン画像:300/400/600dpi
●カメラ画像 :500〜3500万画素
※画像サイズ:最大A3まで
【出力ファイル形式】
●日本語/英語
テキスト、Unicodeテキスト、任意区切り文字テキスト、RTF、CSV、HTML、DOC、DOCX、XLS、XLSX、PPT、PPTX、PDF(通常/透明テキスト付き/高圧縮)、XPS、EPUB
●中国語、韓国語
テキスト、Unicodeテキスト、CSV、HTML、PDF(通常・透明テキスト付き・MRC圧縮)、RTF、DOC、XLS、PPT、DOCX、XLSX、PPTX、XPS、EPUB
●タイ語、ベトナム語、マレー語、インドネシア語
Unicodeテキスト、DOCX、XLSX、PPTX
◇動作環境
【対応OS】
●通常版
Windows 10 / 8.1 / 7
各日本語版に対応
●ServerOS対応版
Windows 10 / 8.1 / 7
Windows Server 2016 Standard
Windows Server 2012 R2 Standard
Windows Server 2012 Standard
Windows Server 2008 R2 Standard / Enterprise
Windows Server 2008 Standard / Enterprise
各日本語版に対応
【対応仮想化商品】※ServerOS対応版のみ
・VMware vSphere Hypervisor(ESXi) 5.5 / 6.0
・Hyper-V 3.0 / 3.1 / 4.0 / 5.0 / 7.0
※ホストOSやゲストOSなどの詳細は当社ホームページをご確認ください。
【動作メモリ】
2GB以上
【開発環境】
Visual C++ VC 9.0 / 10.0 / 11.0 / 12.0
C#(.NET Framework 4.5.2)
【その他】
・64bit版では、32bit互換モード(WOW64)で動作します。
・本ライブラリは同一プロセス内での非同期実行は非対応。
(マルチスレッド呼び出し非対応)。
・アクティベーションを行うためにインターネット接続環境が必要です。
※インターネットに接続できない場合、インターネットに接続可能な別のパソコンを使って代理で認証できます。
■株式会社エヌジェーケーについて
金融決済・社会インフラ・エンタープライズ(業務系)などのシステム開発と、車載・家電・モバイル分野の組込ソフトの開発をメインとしているNTTデータグループの企業です。マンション管理会社向け業務システム「FMSシリーズ」や、「メディアドライブ」ブランドでのOCR(文字認識)ソリューションの提供、IT機器・NTTデータグループのITソリューションの販売も行っております。直近では、エッジコンピューティングやディープラーニングなど、IoTやAIといったIT分野の最新技術開発にも積極的に取り組んでいます。
○公式サイトURL:https://www.njk.co.jp/
○メディアドライブブランドサイト https://mediadrive.jp/
■本件に関するお問い合わせ先
株式会社エヌジェーケー
■ニュースリリースについて
総務部
蓮見 梓(TEL: 03-5117-1900 E-mail:pr-gr@njk.co.jp)
■製品について
メディアドライブ事業部 営業部
TEL:03-5541-9620 FAX:03-5541-9651
※メディアドライブ株式会社は、2017年4月1日に株式会社エヌジェーケーと合併しました。
※Microsoft、Windowsは米国Microsoft Corporationの商標です。
※その他の会社名・商品名は各社の商標または登録商標です。
※記載された内容は予告なく変更することがありますので予めご了承ください。
※記載された内容は2017年7月現在のものです。
※詳しくは当社ホームページをご覧ください。
「活字文書OCRライブラリ v.9.5」は、非定型の活字文書の画像に対して文字認識を行い、認識した文字コードを出力するDLL(ダイナミックリンクライブラリ)です。
本ライブラリを活用することで、お客様のアプリケーションや業務システムなどと連携し、高精度な認識結果をOffice文書や透明テキスト付きPDFなどのファイルフォーマットで出力できます。
本バージョンは、「活字文書OCRライブラリ v.9.0」をベースに、外国言語の認識改良および新機能を搭載し、外国言語の認識に特化したバージョンとしてリリースします。
これまで、既存のアプリケーションや業務システムに英語・中国語・韓国語以外の幅広い言語に対応したOCRライブラリを組み込むには、海外メーカー製のOCRライブラリが中心で、メーカー開発拠点が海外のため「円滑な連携が取れるか不安」、「日本語でのサポートに対応していない」など、海外メーカーとの取引ハードルの高さから、検討が滞ってしまうことも珍しくありませんでした。
本ライブラリは、国内で多数の実績があるOCR専門メーカーが開発、提供するOCRライブラリのため、個別要件のご相談からサポート体制まで、安心してご利用いただけます。
本バージョンの主な特長としては、新たに認識可能な言語として、ご要望が多かったアジア言語(タイ語・ベトナム語・マレー語・インドネシア語)を追加しました。
アジア諸国へ進出する企業や、現地企業・団体等とのつながりがあって、アジア言語の文書を多く取り扱う企業など、アジア言語認識のニーズにご対応いただけます。
また従来認識可能であった英語・中国語・韓国語では、精度向上はもちろん、英語と中国語/韓国語の混在文書にて、言語設定を行わずに高精度な認識が可能となりました。
プレスリリース詳細:https://www.njk.co.jp/latest/48-20170718/
◇発売日
2017年7月18日
◇価格
活字文書OCRライブラリ v.9.5 開発キット
定価 500,000円(税込 540,000円)
活字文書OCRライブラリ v.9.5 開発キット 年間保守サービス
定価 100,000円(108,000円)
活字文書OCRライブラリ v.9.5(Server OS 対応版) 開発キット
定価 750,000円(810,000円)
活字文書OCRライブラリ v.9.5(Server OS 対応版) 開発キット 年間保守サービス
定価 150,000円(162,000円)
【活字文書OCRライブラリ v.9.5 言語別認識オプション】
・タイ語認識オプション
・ベトナム語認識オプション
・マレー語認識オプション
・インドネシア語認識オプション
・欧米語認識オプション
※言語別認識オプションおよびライセンス(ロイヤリティー)価格については、当社営業担当へお問い合わせください。
※年間保守サービスは初年度必須となります。商品購入時にお申し込みください。
◇基本機能
1.日本語・英語・中国語・韓国語の認識が可能です。また日本語、英語は混在認識が可能です。
2.日本語は、JIS第1水準およびJIS第2水準全ての漢字の認識が可能です。
3.中国語は、簡体字および繁体字の認識が可能です。
4.縦書き、横書きの自動判別が可能です。
5.文字サイズ混在文書に対応可能です。
6.認識結果の文字数、外接する矩形座標、候補文字、信頼度データなどの様々な情報を取得可能です。
7.日本語/英語の斜体(イタリック)文字の認識が可能です。※1
8.日本語の縦書き中に横書きで挿入された英字の認識が可能です。
9.デジカメ画像(スマートフォンやデジタルカメラで撮影された画像)専用の認識エンジンを搭載。ピンボケした低品質の画像も高精度に認識できます。
10.つぶれ/かすれ文字で実績のある認識エンジンを搭載。写真モード(文字/写真モード)の設定で白黒スキャンしたカタログ等にみられる文字の劣化を補正して認識できます。※2
11. 欧米語認識オプション
欧米語認識オプション対応可能です。
<オプション標準対応言語>
ドイツ語・フランス語・スペイン語・イタリア語・オランダ語・スウェーデン語・ノルウェー語・フィンランド語・デンマーク語・ポルトガル語・ロシア語
※1日本語は行単位での処理となりますので、行中に標準と斜体の文字が混在している場合は認識精度が低下すること
があります。
※2本機能は日本語/中国語/韓国語の認識時のみ有効です。
◇主な新機能
1.アジア圏言語の一部を認識言語オプションとして追加
(1)タイ語
(2)ベトナム語
(3)マレー語
(4)インドネシア語
2.英語/中国語/韓国語の認識精度向上
(1)英語認識率向上
新英語認識エンジンを搭載し、認識精度が向上しました。
(2)中国語認識率向上
中国語と英語が混在する文書の認識処理が可能になりました。
(3)韓国語認識率向上
韓国語と英語が混在する文書の認識処理が可能になりました。
3.レイアウト解析精度向上
外国言語のレイアウト解析精度が向上しました。
4.マルチプロセス対応
マルチプロセスに対応し、サーバー利用時の処理効率向上が可能になりました。
◇スペック
【認識言語】
●標準:日本語/英語/中国語(簡体・繁体)/韓国語
●オプション:タイ語/ベトナム語/マレー語/インドネシア語/欧米語
※欧米語
ドイツ語・フランス語・スペイン語・イタリア語・オランダ語・スウェーデン語・
ノルウェー語・フィンランド語・デンマーク語・ポルトガル語・ロシア語
【認識書体】
●日本語認識:明朝体・ゴシック体・教科書体等マルチフォント対応
●英語認識 :マルチフォント対応
●中国語/韓国語認識:明朝体・ゴシック体など10種類以上のフォントに対応
●タイ語・ベトナム語・マレー語・インドネシア語認識:マルチフォント対応
【入力ファイル形式】
BMP、JPEG、PNG、PDF(画像のみ)
TIFF(マルチ/シングルページ、非圧縮、G3/G4圧縮、LZW圧縮)
メモリ上の画像データ(DIB形式)
【解像度/画像サイズ】
●スキャン画像:300/400/600dpi
●カメラ画像 :500〜3500万画素
※画像サイズ:最大A3まで
【出力ファイル形式】
●日本語/英語
テキスト、Unicodeテキスト、任意区切り文字テキスト、RTF、CSV、HTML、DOC、DOCX、XLS、XLSX、PPT、PPTX、PDF(通常/透明テキスト付き/高圧縮)、XPS、EPUB
●中国語、韓国語
テキスト、Unicodeテキスト、CSV、HTML、PDF(通常・透明テキスト付き・MRC圧縮)、RTF、DOC、XLS、PPT、DOCX、XLSX、PPTX、XPS、EPUB
●タイ語、ベトナム語、マレー語、インドネシア語
Unicodeテキスト、DOCX、XLSX、PPTX
◇動作環境
【対応OS】
●通常版
Windows 10 / 8.1 / 7
各日本語版に対応
●ServerOS対応版
Windows 10 / 8.1 / 7
Windows Server 2016 Standard
Windows Server 2012 R2 Standard
Windows Server 2012 Standard
Windows Server 2008 R2 Standard / Enterprise
Windows Server 2008 Standard / Enterprise
各日本語版に対応
【対応仮想化商品】※ServerOS対応版のみ
・VMware vSphere Hypervisor(ESXi) 5.5 / 6.0
・Hyper-V 3.0 / 3.1 / 4.0 / 5.0 / 7.0
※ホストOSやゲストOSなどの詳細は当社ホームページをご確認ください。
【動作メモリ】
2GB以上
【開発環境】
Visual C++ VC 9.0 / 10.0 / 11.0 / 12.0
C#(.NET Framework 4.5.2)
【その他】
・64bit版では、32bit互換モード(WOW64)で動作します。
・本ライブラリは同一プロセス内での非同期実行は非対応。
(マルチスレッド呼び出し非対応)。
・アクティベーションを行うためにインターネット接続環境が必要です。
※インターネットに接続できない場合、インターネットに接続可能な別のパソコンを使って代理で認証できます。
■株式会社エヌジェーケーについて
金融決済・社会インフラ・エンタープライズ(業務系)などのシステム開発と、車載・家電・モバイル分野の組込ソフトの開発をメインとしているNTTデータグループの企業です。マンション管理会社向け業務システム「FMSシリーズ」や、「メディアドライブ」ブランドでのOCR(文字認識)ソリューションの提供、IT機器・NTTデータグループのITソリューションの販売も行っております。直近では、エッジコンピューティングやディープラーニングなど、IoTやAIといったIT分野の最新技術開発にも積極的に取り組んでいます。
○公式サイトURL:https://www.njk.co.jp/
○メディアドライブブランドサイト https://mediadrive.jp/
■本件に関するお問い合わせ先
株式会社エヌジェーケー
■ニュースリリースについて
総務部
蓮見 梓(TEL: 03-5117-1900 E-mail:pr-gr@njk.co.jp)
■製品について
メディアドライブ事業部 営業部
TEL:03-5541-9620 FAX:03-5541-9651
※メディアドライブ株式会社は、2017年4月1日に株式会社エヌジェーケーと合併しました。
※Microsoft、Windowsは米国Microsoft Corporationの商標です。
※その他の会社名・商品名は各社の商標または登録商標です。
※記載された内容は予告なく変更することがありますので予めご了承ください。
※記載された内容は2017年7月現在のものです。
※詳しくは当社ホームページをご覧ください。