ビッグデータ分析プラットフォーム「Teradata Aster MapReduce Appliance」を販売開始
[12/10/11]
提供元:PRTIMES
提供元:PRTIMES
日本テラデータ、ビッグデータ分析プラットフォーム「Teradata Aster MapReduce Appliance」を販売開始
-テキストやマシン・センサーログへの対話的な分析環境を提供-
日本テラデータ株式会社(本社:東京都中央区、代表取締役社長:吉川幸彦)は、Webアクセスログ、テキストデータ、マシン・センサーログデータといったビッグデータの分析プラットフォーム「Teradata Aster MapReduce Appliance」を、本日付で販売、出荷開始します。
Teradata Aster MapReduce Applianceは、リレーショナル・データベースと、MapReduce技術を統合した並列処理型のソフトウェアである「Aster」を、ハードウェア・プラットフォームにあらかじめインストールした、ビッグデータ分析のためのアプライアンス製品です。今回は英語バージョンを販売、出荷し、2013年初頭には日本語対応バージョンを販売、出荷する予定です。最小構成の価格は4,130万円(税別、※1)からで、初年度の販売目標額として約20億円を見込んでいます。ビッグデータを保有、有効に活用したいと考える企業を中心に導入を見込んでおり、直販およびパートナー経由で販売します。
当製品の大きな特長として、SQL-MapReduce(R)(※2)とSQL-H(TM)(※3)の2つが挙げられます。SQL-MapReduceは、Webアクセスログ、テキストデータ、マシン・センサーログデータといった多構造化データを分析する際に、高頻度で利用される50以上のMapReduce処理を関数として事前にパッケージ化し、分析ユーザーがSQLの関数として呼び出せる機能です。これにより、多構造化データに対する並列分析処理を、SQL記述とほぼ同等のスキルで対話的、反復的に実施することができます。また、Hadoop分散ファイルシステムに対しても、SQLおよびSQL-MapReduceで直接アクセス可能なSQL-H機能も提供されます。分析ユーザーはSQLおよびSQL-MapReduceを用いるだけで、構造化データと多構造化データの両方を扱うことが可能となります。
従来、リレーショナル・データベースへのアクセスにはデータ操作言語であるSQLが用いられ、データ操作に特化したSQLという平易な言語によって、分析担当者は対話的にデータ分析を行っています。一方、リレーショナル・データベースに格納されるデータは、あらかじめ定義された行と列のテーブル形式に構造化される必要があり、Webサイトのアクセスログ、テキスト文書、マシン・センサーログといった多構造化データの処理には不向きでした。
また、オープンソースで提供されているHadoopは、多構造化データの並列処理フレームワークとしてMapReduceを提供していますが、MapReduceはJavaなどの開発言語を利用する必要があり、データ分析にはソフトウェア開発者と同等のスキルやプログラムの量が必要でした。SQL-MapReduceは、このようなSQLおよびMapReduce双方の利点を含んだ技術です。これにより、多構造化データの分析が容易に実現可能となります。
ログデータに代表される多構造化データは、さまざまな社会事象やビジネスプロセスの詳細な記録であり、そのデータ量は非常に大規模となりえます。本来このようなデータを分析する意義は、その中に隠されているパターンや異常事態を探し出すことにあり、そのためには何度も条件を変更しながら、対話的に分析を行える環境が求められます。Asterは、分析ユーザーのデータアクセス範囲を大幅に押し広げ、一方で分析のスピードと効率を大幅に改善する製品です。
以上
(※1)Teradata Aster MapReduce Appliance
H/W構成・・・4ノード、ユーザーデータ容量6.8TB(非圧縮)、管理ワークステーション
S/W構成・・・Asterデータベース、ベースパッケージ(分析カテゴリーのパス/パターン、統計解析、関係性/グラフ、テキスト、データ変換に含まれる約30のSQL-MapReduce関数)
(※2)SQL-MapReduce(R)
SQL-MapReduceは、基本的にSQLの文法で記述されます。Asterに事前に用意されている50以上のMapReduce関数、もしくは開発者がJavaなどで記述し、Aster内に配備したMapReduce関数をSQL文の中で呼出し、実行することで処理がなされます。代表的な関数は、シーケンシャルな物事の順序や経路を分析するためのnPath関数、順序に基づいて番号を付与していくSessionize関数、文章などのデータをキーワードに分解するTokenize関数が用意されています。
MapReduce関数の詳細はこちらを参照ください。
http://www.teradata-j.com/Aster/aster_02.html
(※3)SQL-H(TM)
SQL-HはHadoop分散ファイルシステム(HDFS: Hadoop Distributed File System)に対して、SQLおよびSQL-MapReduceを利用してアクセスするための機能です。Hadoop環境下において、データはファイルとして管理され、ファイルはデータブロックに分解されて各コンピューター・ノード(Data Node)に分散格納されます。Asterが提供するSQL-Hは、オープンソースで提供されているHadoopの関連ソフトウェア「HCatalog」が提供する、HDFS内ファイルのデータ定義情報を読み取ります。そのためAsterからは、テーブルとカラムを指定するのと同じ方法でHDFS管理下のデータにアクセスし、SQLもしくはSQL-MapReduceを実行することが可能です。
SQL-Hを介して実行された命令に基づき、HDFS内の該当データはAster内に転送され、そのデータに対してSQL、SQL-MapReduceが実行されるため、Asterの並列パフォーマンスを最大限に生かした処理が可能となります。処理結果は分析ユーザーに返されるほか、Asterのテーブル、もしくはHDFS内にファイルとして書き込むことも可能です。
Teradata Asterの詳細はこちらを参照ください。
http://www.teradata-j.com/Aster/index.html
# # #
◆ Teradata Corporationについて
テラデータ・コーポレーションは、統合データウェアハウス、ビッグデータ分析、およびビジネスアプリケーションにフォーカスした、データ分析ソリューション分野における世界最大規模の企業です。革新的な製品とサービスによってデータ統合とビジネスの洞察力を実現し、企業を競争優位へと導くベストな意思決定を可能にしまます。
http://www.teradata.com/
◆ 日本テラデータについて
日本テラデータ株式会社はテラデータ・コーポレーションの日本法人です。データベース・ソフトウェアおよび関連製品を中心に、ハードウェア・プラットフォーム、データウェアハウスに関するコンサルティング、構築支援、教育、メンテナンスサポートなど各種サービスを提供しています。
Teradataは、米国テラデータ・コーポレーションの米国およびその他各国における商標または登録商標です。