ブロード研究所と NVIDIA が Terra クラウド プラットフォームに NVIDIA Claraを実装、生物医学的発見に取り組む 2 万 5,000 人の研究者を支援
[22/09/26]
提供元:PRTIMES
提供元:PRTIMES
提携を通じてゲノム解析ワークフローを加速し、標的治療の発見および発展に寄与する大規模言語モデルを共同開発
[画像: https://prtimes.jp/i/12662/324/resize/d12662-324-ddc7480e01a4794a945a-0.jpg ]
2022 年 9 月 20 日、カリフォルニア州サンタクララ — GTC — NVIDIA は本日、MIT ハーバード大学ブロード研究所 (Broad Institute of MIT and Harvard) と提携し、Terra クラウド プラットフォームとそのユーザー (学界の生物医学研究者、スタートアップ企業および大手製薬企業などの 2 万 5,000 人以上の研究者) に、膨大な量のヘルスケア データを迅速に分析するために必要な AI とアクセラレーション ツールを提供することを発表しました。
このコラボレーションは、NVIDIA の AI における専門知識およびヘルスケア コンピューティング プラットフォームと、ブロード研究所の世界有数の研究者、科学者ならびにオープン プラットフォームを結びつけることを目的とし、以下の 3 つの主要領域に焦点を当てます。
● Terra プラットフォームに NVIDIA Clara™ Parabricks(R) (https://www.nvidia.com/ja-jp/clara/genomics/ ) を実装: シーケンシング データの二次解析に用いられる、GPU アクセラレーテッド ソフトウェアのスイートである Parabricks が、6 つの新しい Terra ワークフローで利用できるようになりました。ユーザーは Clara Parabricks を活用することで、これまで CPU ベースの環境で 24 時間かかっていた全ゲノム解析を 1 時間程度で行えるようになり、コンピューティングにかかる費用を半分以下に削減できるようになっています。
● 大規模言語モデル (LLM) の構築: 研究者は、生命の基本要素である DNA および RNA の基盤モデルを構築し、生物学に向けた大規模言語モデルとして本日発表された AI アプリケーション フレームワーク、NVIDIA BioNeMo (https://nvidianews.nvidia.com/news/nvidia-launches-large-language-model-cloud-services-to-advance-ai-and-digital-biology ) を使ってヒト生物学の理解を深めることができるようになります。
● ゲノム解析ツールキット (GATK) に、より優れたディープラーニングを実装: NVIDIA はブロード研究所の GATK ツールキットに、新しいディープラーニング モデルを直接提供します。このツールキットは 10 万人以上の研究者が使用しており、業界標準となっています。ディープラーニング モデルによって、疾病に関係する遺伝的変異体の発見が推進されるようになり、創薬研究者は新しい治療法を開発できるようになります。
NVIDIA のヘルスケア担当バイス プレジデントであるキンバリー パウエル (Kimberly Powell) は、次のように述べています。「ヘルスケア エコシステム全体が、疾病を理解し、診断方法を開発し、治療法を提供するためのブレイクスルーをもたらしてくれる、より良いコンピュテーショナル ツールを求めています。ブロード研究所とのコラボレーションを拡大することで、NVIDIA は大規模言語モデルのパワーを提供できるようになります。最終的には共同のソリューションを構築することで、研究者の洞察と患者にとっての実際の便益との差を縮小できるようになるでしょう」
ブロード研究所は、研究者同士を結びつけるだけでなく、科学的ブレイクスルーを達成するのに必要なデータセットとツールを研究者が利用可能な、オープンクラウド プラットフォームを提供することで、次世代のコラボレーティブな生物医学研究を推進することを目指しています。
ブロード研究所のチーフ データ オフィサーのアンソニー フィリッパケス (Anthony Philippakis) 氏は、次のように話しています。「ライフサイエンスはデータ革命の真っ只中にあり、研究者は生体医学で機械学習を活用する新しいアプローチを切実に求めています。今回のコラボレーションにより、当研究所では、データ共有とコラボレーティブなプロセスというミッションを強化し、遺伝子学的研究をさらにスケールアップすることを目指しています」
大規模言語モデルで疾病を研究
NVIDIA の BioNeMo フレームワーク (https://blogs.nvidia.com/blog/2022/09/20/bionemo-large-language-models-drug-discovery/ )には、タンパク質および化学のための事前トレーニング済み LLM が含まれており、トレーニング、推論および拡張を簡略化することができます。BioNeMo は、NVIDIA NeMo Megatron (https://developer.nvidia.com/nemo/megatron ) フレームワークを発展させたもので、化学、タンパク質および DNA/RNA 配列といった領域に特化しています。
BioNeMo により、研究者は数十億のパラメーターを持つ、生物学向け LLM のトレーニングと導入を効果的に行えるようになります。さらに、両組織の共同チームが協業することで、BioNeMo コレクションに追加される新モデルを構築し、その成果を Terra プラットフォームで利用できるようにします。
NVIDIA ソフトウェアにより、領域特化型 AI を実現
NVIDIA Parabricks の GPU アクセラレーテッド ワークフローにより、研究者は、ターンアラウンド タイムを短縮し、多様なゲノムデータ解析のための費用を削減することができます。ブロード研究所の GATK によるベスト プラクティスの生殖細胞系列ワークフローでは、GPU で Parabricks による解析を実行した場合、従来と比較し 24 倍ほど早くなり、費用は半分以下になります。
さらに、ブロード研究所の研究者は、医用画像 AI のためのオープンソース ディープラーニング フレームワークである MONAI (https://monai.io/ )、ならびにゲノムの単一細胞解析においてより迅速なデータ準備を可能にする、GPU アクセラレーテッド データサイエンス ツールキットである NVIDIA RAPIDS™ (https://www.nvidia.com/ja-jp/deep-learning-ai/software/rapids/ ) を利用できるようになります。
TerraへのClara Parabricks の実装(https://terra.bio/nvidias-clara-parabricks-workflows-in-terra-bring-gpu-acceleration-to-genomic-analysis )についての詳しい情報を知るためには、NVIDIA BioNeMo LLM サービスのアーリーアクセス(https://www.nvidia.com/en-us/gpu-cloud/bionemo/ )に申請してください。
NVIDIA について
1993 年の創業以来、NVIDIA (NASDAQ: NVDA) は、アクセラレーテッド コンピューティングのパイオニアとして活動してきました。1999年の GPU の発明は、PC ゲーミング市場の成長に拍車をかけ、コンピュータ グラフィックスを再定義し、現在の AI 時代の火付け役となりました。NVIDIA は現在、データセンター規模の製品を提供するフルスタック コンピューティング企業であり、産業のあり方を大きく変えています。詳細は、こちらのリンクから:https://nvidianews.nvidia.com/
[画像: https://prtimes.jp/i/12662/324/resize/d12662-324-ddc7480e01a4794a945a-0.jpg ]
2022 年 9 月 20 日、カリフォルニア州サンタクララ — GTC — NVIDIA は本日、MIT ハーバード大学ブロード研究所 (Broad Institute of MIT and Harvard) と提携し、Terra クラウド プラットフォームとそのユーザー (学界の生物医学研究者、スタートアップ企業および大手製薬企業などの 2 万 5,000 人以上の研究者) に、膨大な量のヘルスケア データを迅速に分析するために必要な AI とアクセラレーション ツールを提供することを発表しました。
このコラボレーションは、NVIDIA の AI における専門知識およびヘルスケア コンピューティング プラットフォームと、ブロード研究所の世界有数の研究者、科学者ならびにオープン プラットフォームを結びつけることを目的とし、以下の 3 つの主要領域に焦点を当てます。
● Terra プラットフォームに NVIDIA Clara™ Parabricks(R) (https://www.nvidia.com/ja-jp/clara/genomics/ ) を実装: シーケンシング データの二次解析に用いられる、GPU アクセラレーテッド ソフトウェアのスイートである Parabricks が、6 つの新しい Terra ワークフローで利用できるようになりました。ユーザーは Clara Parabricks を活用することで、これまで CPU ベースの環境で 24 時間かかっていた全ゲノム解析を 1 時間程度で行えるようになり、コンピューティングにかかる費用を半分以下に削減できるようになっています。
● 大規模言語モデル (LLM) の構築: 研究者は、生命の基本要素である DNA および RNA の基盤モデルを構築し、生物学に向けた大規模言語モデルとして本日発表された AI アプリケーション フレームワーク、NVIDIA BioNeMo (https://nvidianews.nvidia.com/news/nvidia-launches-large-language-model-cloud-services-to-advance-ai-and-digital-biology ) を使ってヒト生物学の理解を深めることができるようになります。
● ゲノム解析ツールキット (GATK) に、より優れたディープラーニングを実装: NVIDIA はブロード研究所の GATK ツールキットに、新しいディープラーニング モデルを直接提供します。このツールキットは 10 万人以上の研究者が使用しており、業界標準となっています。ディープラーニング モデルによって、疾病に関係する遺伝的変異体の発見が推進されるようになり、創薬研究者は新しい治療法を開発できるようになります。
NVIDIA のヘルスケア担当バイス プレジデントであるキンバリー パウエル (Kimberly Powell) は、次のように述べています。「ヘルスケア エコシステム全体が、疾病を理解し、診断方法を開発し、治療法を提供するためのブレイクスルーをもたらしてくれる、より良いコンピュテーショナル ツールを求めています。ブロード研究所とのコラボレーションを拡大することで、NVIDIA は大規模言語モデルのパワーを提供できるようになります。最終的には共同のソリューションを構築することで、研究者の洞察と患者にとっての実際の便益との差を縮小できるようになるでしょう」
ブロード研究所は、研究者同士を結びつけるだけでなく、科学的ブレイクスルーを達成するのに必要なデータセットとツールを研究者が利用可能な、オープンクラウド プラットフォームを提供することで、次世代のコラボレーティブな生物医学研究を推進することを目指しています。
ブロード研究所のチーフ データ オフィサーのアンソニー フィリッパケス (Anthony Philippakis) 氏は、次のように話しています。「ライフサイエンスはデータ革命の真っ只中にあり、研究者は生体医学で機械学習を活用する新しいアプローチを切実に求めています。今回のコラボレーションにより、当研究所では、データ共有とコラボレーティブなプロセスというミッションを強化し、遺伝子学的研究をさらにスケールアップすることを目指しています」
大規模言語モデルで疾病を研究
NVIDIA の BioNeMo フレームワーク (https://blogs.nvidia.com/blog/2022/09/20/bionemo-large-language-models-drug-discovery/ )には、タンパク質および化学のための事前トレーニング済み LLM が含まれており、トレーニング、推論および拡張を簡略化することができます。BioNeMo は、NVIDIA NeMo Megatron (https://developer.nvidia.com/nemo/megatron ) フレームワークを発展させたもので、化学、タンパク質および DNA/RNA 配列といった領域に特化しています。
BioNeMo により、研究者は数十億のパラメーターを持つ、生物学向け LLM のトレーニングと導入を効果的に行えるようになります。さらに、両組織の共同チームが協業することで、BioNeMo コレクションに追加される新モデルを構築し、その成果を Terra プラットフォームで利用できるようにします。
NVIDIA ソフトウェアにより、領域特化型 AI を実現
NVIDIA Parabricks の GPU アクセラレーテッド ワークフローにより、研究者は、ターンアラウンド タイムを短縮し、多様なゲノムデータ解析のための費用を削減することができます。ブロード研究所の GATK によるベスト プラクティスの生殖細胞系列ワークフローでは、GPU で Parabricks による解析を実行した場合、従来と比較し 24 倍ほど早くなり、費用は半分以下になります。
さらに、ブロード研究所の研究者は、医用画像 AI のためのオープンソース ディープラーニング フレームワークである MONAI (https://monai.io/ )、ならびにゲノムの単一細胞解析においてより迅速なデータ準備を可能にする、GPU アクセラレーテッド データサイエンス ツールキットである NVIDIA RAPIDS™ (https://www.nvidia.com/ja-jp/deep-learning-ai/software/rapids/ ) を利用できるようになります。
TerraへのClara Parabricks の実装(https://terra.bio/nvidias-clara-parabricks-workflows-in-terra-bring-gpu-acceleration-to-genomic-analysis )についての詳しい情報を知るためには、NVIDIA BioNeMo LLM サービスのアーリーアクセス(https://www.nvidia.com/en-us/gpu-cloud/bionemo/ )に申請してください。
NVIDIA について
1993 年の創業以来、NVIDIA (NASDAQ: NVDA) は、アクセラレーテッド コンピューティングのパイオニアとして活動してきました。1999年の GPU の発明は、PC ゲーミング市場の成長に拍車をかけ、コンピュータ グラフィックスを再定義し、現在の AI 時代の火付け役となりました。NVIDIA は現在、データセンター規模の製品を提供するフルスタック コンピューティング企業であり、産業のあり方を大きく変えています。詳細は、こちらのリンクから:https://nvidianews.nvidia.com/