無料のソフトウェアでペーパーレスを促進 スキャナで取り込んだ文書も検索可能な全文検索システム 2022年4月1日より構築サービス提供開始
[22/03/24]
提供元:@Press
提供元:@Press
オープンソースソフトウェア(以下、OSS)(※1)に特化したIT企業である株式会社デージーネット(本社:愛知県名古屋市、代表取締役:恒川 裕康)は、2022年4月1日(金)より、OCR(※2)機能を付加した全文検索システムをOSSを使って構築するサービスの提供を開始します。これにより、スキャナで取り込んだ書類もWEBブラウザから検索できるようになり、業務効率を向上することも可能になります。
画像1: https://www.atpress.ne.jp/releases/302988/LL_img_302988_1.png
OCRを付加した全文検索システムの利用イメージ
■ペーパーレス化の必要性
近年、企業におけるペーパーレス化が注目されています。注目されている理由としては大きく2つあります。
1. 環境保全への取り組み
紙を生産するためには、森林伐採が必要です。この森林減少に伴い、地球温暖化への影響などが懸念されています。このような背景から、環境保全への取り組みとしてペーパーレス化が注目されています。
2. 働き方改革に対応するためのデジタル化
企業では、テレワークやリモートワークに対応するため、文書をデジタル化することで必要な書類にどこからでもアクセスできるようにすることが必要になっています。
さらに、政府では経済社会のデジタル化を踏まえ、電子帳簿保存法が2022年1月に改正されました。電子帳簿保存法の「電子保存の義務化」に関しては2年の猶予期間が設けられることになりましたが、国全体での取り組みとしてもペーパーレス化が推進されています。
■OCR機能を付加した全文検索システム
このように、企業や国全体の取り組みとしてペーパーレス化が推進される中、課題となるのが過去の書類です。昔の社内文書など、紙の書類はスキャナで取り込むことでデジタル化することができます。
しかし、ただスキャナで取り込むだけでは、デジタル化した文書を検索ができないなど、データの活用方法に課題が残ります。
そこでデージーネットは、企業が過去の書類もデータとして活用できるようにするため、OCRを付加した全文検索システムをOSSを使って構築するサービスを2022年4月1日より開始します。
■OCR機能を付加した全文検索システムの特徴
デージーネットが提供する全文検索システムは優れた検索機能を持っています。そこにOCR機能を付加することで、スキャナで読み込んだ紙の書類もデータとして活用できるようになりました。
デージーネットが提供する全文検索システムには、以下のような特徴があります。
1. スキャンした書類も高認識
一般的なプリンターで出力した文書をサイズを変えて印刷し、印刷した用紙をスキャナで読みった場合の認識率は以下の通りです。
用紙のサイズ 認識率
等倍 99.02%
1/2倍 99.42%
1/4倍 99.32%
このように、紙の書類をスキャンした場合でも文字を高い認識率で扱うことができます。
2. 大量のデータでも高速な全文検索を実現
検索の対象となるデータを検索し易い形式で保存するため、大量のデータから欲しい情報を瞬時に検索することが可能です。もちろん、日本語検索も可能です。
3. 様々なファイル形式に対応
WordやExcelなどのMS Office形式やPDFはもちろん、XMLやHTML、zipなどの圧縮ファイル、さらにmp3などのメタ情報まで様々なファイル形式に対応しています。
4. 多くの検索方法を搭載
AND検索(※3)やOR検索(※4)など、様々な検索方法が利用可能です。そのため検索方法を工夫すれば、目的としているページやファイルへの到達性を向上することができます。
■OCR機能を付加した全文検索システム導入のメリット
OCR機能を付加した全文検索システムを導入することで、以下のようなメリットがあります。
1. 業務効率の向上
社内で保管していた紙の書類をデジタル化することで、WEBブラウザから検索を行うことができるようになります。これにより、欲しい情報にすぐにアクセスすることが可能になり、業務効率を向上することができます。
2. コストの削減
今まで印刷して管理していた書類をPDFなどデータで管理することで、紙の使用量や印刷などのコストを削減することができます。
3. 情報の省スペース化
書類をデジタル化することで、物理的な書類保管スペースを削減できます。
このように、OCR機能を付加した全文検索システムを導入することで、スキャナで取り込んだ紙の文書も検索できるようになり、ペーパーレス化を推進しつつ業務効率も向上することが可能です。
■価格
構築費用:700,000円〜(ハードウェア別)
保守費用:105,000円〜/年
(詳しくはお問い合わせください)
■用語注釈
(※1) オープンソースソフトウェア
オープンソースソフトウェア(略称:OSS)とは、無償で利用でき、ソースコードが公開されているソフトウェアのことです。
(※2) OCR
OCRとは、画像データの文字を認識し、コンピュータで利用できる文字データに変換する技術のことです。
(※3) AND検索
AND検索とは、複数の条件をいずれも満たすものを検索する方法のことです。
(※4) OR検索
OR検索とは、複数の条件のうち少なくともいずれか一つを満たすものを検索する方法のことです。
■デージーネットのサービス
1. システムの構築
デージーネットでは、OSSを利用したシステムの提案・構築を行っています。デージーネットで利用しているOSSは多岐にわたり、お客様に合ったOSSでシステム構築を行うことが可能です。
2. 導入後支援サービス
デージーネットでシステムを構築した場合、OpenSmartAssistanceという導入後サポートを提供しています。継続してシステム管理のサポートを行うサービスで、以下のようなサポートがあります。
・Q&A(インストールしたOSSやソフトウェアの利用方法に関してのご質問にお答えします。)
・セキュリティ情報提供
・点検とチューニング
・障害調査、障害回避
・障害時オンサイト対応
・障害時システム再構築
・運用サービス
・ソフトウェアのアップデート
■参考URL
・OCRで文書画像の検索
https://www.designet.co.jp/ossinfo/fess/ocr/
■会社概要
会社名: 株式会社デージーネット
代表者: 代表取締役 恒川 裕康
本社 : 〒465-0025 愛知県名古屋市名東区上社四丁目39-1
資本金: 4,000万円
URL : https://www.designet.co.jp/
<一般の方からのお問い合わせ先>
https://www.designet.co.jp/contact/
画像1: https://www.atpress.ne.jp/releases/302988/LL_img_302988_1.png
OCRを付加した全文検索システムの利用イメージ
■ペーパーレス化の必要性
近年、企業におけるペーパーレス化が注目されています。注目されている理由としては大きく2つあります。
1. 環境保全への取り組み
紙を生産するためには、森林伐採が必要です。この森林減少に伴い、地球温暖化への影響などが懸念されています。このような背景から、環境保全への取り組みとしてペーパーレス化が注目されています。
2. 働き方改革に対応するためのデジタル化
企業では、テレワークやリモートワークに対応するため、文書をデジタル化することで必要な書類にどこからでもアクセスできるようにすることが必要になっています。
さらに、政府では経済社会のデジタル化を踏まえ、電子帳簿保存法が2022年1月に改正されました。電子帳簿保存法の「電子保存の義務化」に関しては2年の猶予期間が設けられることになりましたが、国全体での取り組みとしてもペーパーレス化が推進されています。
■OCR機能を付加した全文検索システム
このように、企業や国全体の取り組みとしてペーパーレス化が推進される中、課題となるのが過去の書類です。昔の社内文書など、紙の書類はスキャナで取り込むことでデジタル化することができます。
しかし、ただスキャナで取り込むだけでは、デジタル化した文書を検索ができないなど、データの活用方法に課題が残ります。
そこでデージーネットは、企業が過去の書類もデータとして活用できるようにするため、OCRを付加した全文検索システムをOSSを使って構築するサービスを2022年4月1日より開始します。
■OCR機能を付加した全文検索システムの特徴
デージーネットが提供する全文検索システムは優れた検索機能を持っています。そこにOCR機能を付加することで、スキャナで読み込んだ紙の書類もデータとして活用できるようになりました。
デージーネットが提供する全文検索システムには、以下のような特徴があります。
1. スキャンした書類も高認識
一般的なプリンターで出力した文書をサイズを変えて印刷し、印刷した用紙をスキャナで読みった場合の認識率は以下の通りです。
用紙のサイズ 認識率
等倍 99.02%
1/2倍 99.42%
1/4倍 99.32%
このように、紙の書類をスキャンした場合でも文字を高い認識率で扱うことができます。
2. 大量のデータでも高速な全文検索を実現
検索の対象となるデータを検索し易い形式で保存するため、大量のデータから欲しい情報を瞬時に検索することが可能です。もちろん、日本語検索も可能です。
3. 様々なファイル形式に対応
WordやExcelなどのMS Office形式やPDFはもちろん、XMLやHTML、zipなどの圧縮ファイル、さらにmp3などのメタ情報まで様々なファイル形式に対応しています。
4. 多くの検索方法を搭載
AND検索(※3)やOR検索(※4)など、様々な検索方法が利用可能です。そのため検索方法を工夫すれば、目的としているページやファイルへの到達性を向上することができます。
■OCR機能を付加した全文検索システム導入のメリット
OCR機能を付加した全文検索システムを導入することで、以下のようなメリットがあります。
1. 業務効率の向上
社内で保管していた紙の書類をデジタル化することで、WEBブラウザから検索を行うことができるようになります。これにより、欲しい情報にすぐにアクセスすることが可能になり、業務効率を向上することができます。
2. コストの削減
今まで印刷して管理していた書類をPDFなどデータで管理することで、紙の使用量や印刷などのコストを削減することができます。
3. 情報の省スペース化
書類をデジタル化することで、物理的な書類保管スペースを削減できます。
このように、OCR機能を付加した全文検索システムを導入することで、スキャナで取り込んだ紙の文書も検索できるようになり、ペーパーレス化を推進しつつ業務効率も向上することが可能です。
■価格
構築費用:700,000円〜(ハードウェア別)
保守費用:105,000円〜/年
(詳しくはお問い合わせください)
■用語注釈
(※1) オープンソースソフトウェア
オープンソースソフトウェア(略称:OSS)とは、無償で利用でき、ソースコードが公開されているソフトウェアのことです。
(※2) OCR
OCRとは、画像データの文字を認識し、コンピュータで利用できる文字データに変換する技術のことです。
(※3) AND検索
AND検索とは、複数の条件をいずれも満たすものを検索する方法のことです。
(※4) OR検索
OR検索とは、複数の条件のうち少なくともいずれか一つを満たすものを検索する方法のことです。
■デージーネットのサービス
1. システムの構築
デージーネットでは、OSSを利用したシステムの提案・構築を行っています。デージーネットで利用しているOSSは多岐にわたり、お客様に合ったOSSでシステム構築を行うことが可能です。
2. 導入後支援サービス
デージーネットでシステムを構築した場合、OpenSmartAssistanceという導入後サポートを提供しています。継続してシステム管理のサポートを行うサービスで、以下のようなサポートがあります。
・Q&A(インストールしたOSSやソフトウェアの利用方法に関してのご質問にお答えします。)
・セキュリティ情報提供
・点検とチューニング
・障害調査、障害回避
・障害時オンサイト対応
・障害時システム再構築
・運用サービス
・ソフトウェアのアップデート
■参考URL
・OCRで文書画像の検索
https://www.designet.co.jp/ossinfo/fess/ocr/
■会社概要
会社名: 株式会社デージーネット
代表者: 代表取締役 恒川 裕康
本社 : 〒465-0025 愛知県名古屋市名東区上社四丁目39-1
資本金: 4,000万円
URL : https://www.designet.co.jp/
<一般の方からのお問い合わせ先>
https://www.designet.co.jp/contact/