Cloudera、ブロード研究所と次世代ゲノム解析ツールキットを開発
[16/04/19]
提供元:PRTIMES
提供元:PRTIMES
Apache Sparkを使用しCloudera Enterprise上でバイオインフォマティクス(生物情報学)の スタンダードとして、ゲノム研究の促進に向けデザインされたGATK4を開発
2016年4月6日 米国カリフォルニア州パロアルト発 - Apache Hadoopと最新のオープンソーステクノロジーをベースに、最も高速で最も使いやすく、セキュアなデータ管理と分析を実現するプラットフォームを提供するClouderaは、本日、生物医学とゲノム研究の世界最先端をいくマサチューセッツ工科大およびハーバード大の研究施設のブロード研究所との協業を発表しました。2つの組織は、次世代のゲノム解析ツールキット“GATK4"の開発を推進するために、今年度共同で作業を行います。
Cloudera Enterpriseは、臨床医や研究者および患者個人の実体験に目を向けたリアルタイムデータを応用し、生命科学の研究や薬品開発のスピードを加速していきます。ブロード研究所では、Cloudera Enterprise上で第4世代GATK (GATK4) を構築し、データ処理速度の研究にSparkの分散コンピューティングフレームワークを活用することで、ゲノム配列の理解をより深めています。これによって、より迅速なデータの探究を促し、最終的により高度な臨床決定が可能となります。
2000年に、ヒトゲノムプロジェクトが最初のヒトゲノム配列のアイデアを示して以降、配列を解析するためのコストはゲノムあたり約1億ドルから千ドルへと急激に低下しました。そしてこれと同時に、Hadoopのようなビッグデータテクノロジーによるストレージと処理能力の劇的な進化が見られました。
Cloudera生命科学分野のリーダーであるShawn Dolleyは、「ゲノム配列を解析するコストが下がった事に加え、ビッグデータ分析技術の進歩によって、膨大な量の患者たちのゲノム配列の解析やこれまで不可能に思えたデータセットの作成が可能となりました。Sparkによって次世代ツールキットを構築することで、インメモリーコンピューティングがさらに高速化し、並列処理も可能となります。Cloudera Enterpriseは、データへのアクセスやデータディスカバリーに向けた処理を迅速化し、研究開発時間の短縮をもたらします。これは科学における可能性追求において重要な意味を持つでしょう」と話します。
現在、GATKには31,000を超えるユーザー登録があります。
共同研究者達と共にブロード研究所(https://www.broadinstitute.org/news/8065)は、アクセスを拡大し、さらに強力な分析能力と(臨床)決定ができるゲノム解析ツールの利用を容易にするcloud-hosteのオプション開発に取り組んでいます。利用者は、より簡単に完璧なパイプライン(データグループ)を作成し、インフラの重複を避けることができます。
ブロード研究所の情報科学と情報技術責任者でありGATKのソフトウェアパッケージ研究の統括者Dr.Eric Banks氏は、「Cloudera Enterprise上でSparkのコンピューターフレームワークを活用することで、GATK3では、以前はコンピューター上の処理が複雑なため不可能だった技術を獲得することができました。Cloudera Enterpriseによって、現在我々は、旧バージョンのGATKより2桁もスピーディにゲノムデータを処理できます。そして、ゲノムイノベーションに役立つ高速の反復解析をすることが可能となりました」と述べています。
Clouderaについて
Clouderaは、Apache Hadoopや最新のオープンソーステクノロジーに基づく、今の時代に則したデータ管理や分析のためのプラットフォームを提供する企業です。世界の名だたる企業が、Clouderaの高速で容易に扱うことができる、優れたセキュリティ機能を持つデータプラットフォームであるCloudera Enterpriseを利用し、もっとも困難な業務課題の解決にあたっています。Clouderaのカスタマーは、膨大な量のデータを効果的に収集、ストア、処理、分析し、高度な分析機能に応用することで、以前では成し得ないほど迅速で柔軟な業務上の意思決定を、低コストで実現しています。またClouderaは、カスタマーの確実な成功を支援するため総合的なサポートやトレーニング、プロフェッショナルサービスを提供しています。
Cloudera の情報は下記よりご覧いただけます
・ウェブサイト : http://www.cloudera.co.jp/
・ブログ : http://www.cloudera.co.jp/blog
・正規販売代理店ご紹介ページ :http://www.cloudera.co.jp/company/partner.html
・Hadoop10周年記念ページ:http://www.cloudera.co.jp/promos/hadoop10.html
・Twitter : http://twitter.com/#!/clouderajp
・Facebook : http://www.facebook.com/Cloudera.Japan
Cloudera、Cloudera’s Platform for Big Data、Cloudera Enterprise Data Hub Edition、Cloudera Enterprise Flex Edition、Cloudera Enterprise Basic Edition、Cloudera Navigator OptimizerおよびCDHはCloudera Inc.の米国および他国の管轄権における商標または登録商標です。その他の社名および製品名は一般にその商標です。
報道関係者の方からのお問い合わせ先
Cloudera株式会社
マーケティング担当:木林
press-jp@cloudera.com
2016年4月6日 米国カリフォルニア州パロアルト発 - Apache Hadoopと最新のオープンソーステクノロジーをベースに、最も高速で最も使いやすく、セキュアなデータ管理と分析を実現するプラットフォームを提供するClouderaは、本日、生物医学とゲノム研究の世界最先端をいくマサチューセッツ工科大およびハーバード大の研究施設のブロード研究所との協業を発表しました。2つの組織は、次世代のゲノム解析ツールキット“GATK4"の開発を推進するために、今年度共同で作業を行います。
Cloudera Enterpriseは、臨床医や研究者および患者個人の実体験に目を向けたリアルタイムデータを応用し、生命科学の研究や薬品開発のスピードを加速していきます。ブロード研究所では、Cloudera Enterprise上で第4世代GATK (GATK4) を構築し、データ処理速度の研究にSparkの分散コンピューティングフレームワークを活用することで、ゲノム配列の理解をより深めています。これによって、より迅速なデータの探究を促し、最終的により高度な臨床決定が可能となります。
2000年に、ヒトゲノムプロジェクトが最初のヒトゲノム配列のアイデアを示して以降、配列を解析するためのコストはゲノムあたり約1億ドルから千ドルへと急激に低下しました。そしてこれと同時に、Hadoopのようなビッグデータテクノロジーによるストレージと処理能力の劇的な進化が見られました。
Cloudera生命科学分野のリーダーであるShawn Dolleyは、「ゲノム配列を解析するコストが下がった事に加え、ビッグデータ分析技術の進歩によって、膨大な量の患者たちのゲノム配列の解析やこれまで不可能に思えたデータセットの作成が可能となりました。Sparkによって次世代ツールキットを構築することで、インメモリーコンピューティングがさらに高速化し、並列処理も可能となります。Cloudera Enterpriseは、データへのアクセスやデータディスカバリーに向けた処理を迅速化し、研究開発時間の短縮をもたらします。これは科学における可能性追求において重要な意味を持つでしょう」と話します。
現在、GATKには31,000を超えるユーザー登録があります。
共同研究者達と共にブロード研究所(https://www.broadinstitute.org/news/8065)は、アクセスを拡大し、さらに強力な分析能力と(臨床)決定ができるゲノム解析ツールの利用を容易にするcloud-hosteのオプション開発に取り組んでいます。利用者は、より簡単に完璧なパイプライン(データグループ)を作成し、インフラの重複を避けることができます。
ブロード研究所の情報科学と情報技術責任者でありGATKのソフトウェアパッケージ研究の統括者Dr.Eric Banks氏は、「Cloudera Enterprise上でSparkのコンピューターフレームワークを活用することで、GATK3では、以前はコンピューター上の処理が複雑なため不可能だった技術を獲得することができました。Cloudera Enterpriseによって、現在我々は、旧バージョンのGATKより2桁もスピーディにゲノムデータを処理できます。そして、ゲノムイノベーションに役立つ高速の反復解析をすることが可能となりました」と述べています。
Clouderaについて
Clouderaは、Apache Hadoopや最新のオープンソーステクノロジーに基づく、今の時代に則したデータ管理や分析のためのプラットフォームを提供する企業です。世界の名だたる企業が、Clouderaの高速で容易に扱うことができる、優れたセキュリティ機能を持つデータプラットフォームであるCloudera Enterpriseを利用し、もっとも困難な業務課題の解決にあたっています。Clouderaのカスタマーは、膨大な量のデータを効果的に収集、ストア、処理、分析し、高度な分析機能に応用することで、以前では成し得ないほど迅速で柔軟な業務上の意思決定を、低コストで実現しています。またClouderaは、カスタマーの確実な成功を支援するため総合的なサポートやトレーニング、プロフェッショナルサービスを提供しています。
Cloudera の情報は下記よりご覧いただけます
・ウェブサイト : http://www.cloudera.co.jp/
・ブログ : http://www.cloudera.co.jp/blog
・正規販売代理店ご紹介ページ :http://www.cloudera.co.jp/company/partner.html
・Hadoop10周年記念ページ:http://www.cloudera.co.jp/promos/hadoop10.html
・Twitter : http://twitter.com/#!/clouderajp
・Facebook : http://www.facebook.com/Cloudera.Japan
Cloudera、Cloudera’s Platform for Big Data、Cloudera Enterprise Data Hub Edition、Cloudera Enterprise Flex Edition、Cloudera Enterprise Basic Edition、Cloudera Navigator OptimizerおよびCDHはCloudera Inc.の米国および他国の管轄権における商標または登録商標です。その他の社名および製品名は一般にその商標です。
報道関係者の方からのお問い合わせ先
Cloudera株式会社
マーケティング担当:木林
press-jp@cloudera.com