ネットソリューションズ。圧縮インデックスライブラリ「TXTCache」をリリース。
[08/11/17]
提供元:DreamNews
提供元:DreamNews
有限会社ネットソリューションズは、11月15日、Javaによる圧縮インデックスライブラリの「TXTCache」をリリースした。
報道関係者各位
2008年11月15日
ネットソリューションズ。圧縮インデックスライブラリ「TXTCache」をリリース。
有限会社ネットソリューションズ(山梨県富士吉田市 代表取締役 佐々木権一)は、11月15日、Javaによる圧縮インデックスライブラリの「TXTCache」をリリースした。
現在、全文検索の有用性は広く認められている。同ライブラリは、圧縮技術を用いた全文検索を可能にする。同ライブラリによる索引付けは、同ライブラリによる索引付けは、データ量が非常にコンパクトである。そのため、メモリやマシンなどのリソースを有効利用した、効率的な検索を行うことができる。
また、単純なAPIから利用可能で、HDDへのデータの保存にも対応している。オンメモリ処理を行う、高速な検索エンジン、文字列に関するエンジンなどの開発が可能となる。同ライブラリは、オープンソースとなっている。ライセンスは、GPLとLGPLの選択方式で、無償で利用できる。
詳しくは下記のURLを参照のこと。
URL : http://txtcache.com/
【圧縮インデックス】
圧縮インデックスとは、圧縮技術を用いたデータの索引付けのことで、いくつかのデータ構造が研究されている。「TXTCache」には、これらのデータ構造の内、接尾辞配列(Suffix Array)、圧縮接尾辞配列(Compressed Suffix Array)、LZ-Index、FM-Indexなどが含まれている。
これらのインデックスにより、索引付けのデータが、非常にコンパクトとなり、メモリやマシンを有効に利用した、高性能な検索エンジンの開発に役立てることができる。
【開発の背景】
OSの64bit化、メモリの低価格化、大容量化などにより、データをメモリ上に置いたまま処理するシステム事例が増えている。その一方で、独自の研究開発に基づいたユニークなデータモデルの開発は容易ではない。
「TXTCache」は、最新の検索技術を、サーバーサイドの言語の一つとして定着したJavaで実装を行うと共に、単純なAPIから利用可能にすることで、競争優位性の高い、ユニークなサービスを生み出すことを目的として、開発されました。
【ライブラリ名の由来】
TXTとは、TEXTの略で、文書を意味します。Cacheとは、データの格納場所を意味します。文書の効率的なオンメモリ索引付け処理を中心に、既存のデジタル資産を有効活用し、ユニークなデータモデルを構築するソリューションとして名付けられました。
【報道関係の方のお問い合わせ先】
電子メール : pr@txtcache.com
TEL : 050-7522-6454
担当 : 佐々木
-------------------------------------------------------------------
TXTCache Index uniquely
有限会社ネットソリューションズ
〒403-0005 山梨県富士吉田市上吉田4204-4
TEL : 050-7522-6454
FAX : 0555-24-3815
ホームページ : http://txtcache.com/
-------------------------------------------------------------------
詳細はこちら