スーパーコンピュータ「富岳」が機械学習処理ベンチマークMLPerf HPCで世界第1位を獲得
[21/11/18]
TOKYO, Nov 18, 2021 - (JCN Newswire) - 国立研究開発法人理化学研究所(注1)(以下、理研)と富士通株式会社(注2)(以下、富士通)が、スーパーコンピュータ規模の処理を必要とする大規模機械学習処理のベンチマーク「MLPerf HPC」の一つである「CosmoFlow(注3)」において、スーパーコンピュータ「富岳」の約半分の規模(注4)を用いて計測した結果、世界最高速度を達成し第1位を獲得しました。
「MLPerf HPC」は、単位時間あたりに深層学習モデルをいくつ学習できるか(スループット性能)を測定(注5)するもので、「富岳」の並列処理性能をさらに引き出すソフトウェア技術により、他システムの性能と比較し約1.77倍の処理速度を達成し、機械学習を利用した大規模な科学技術計算の分野において世界最高レベルの性能を有していることが示されました。
今回の結果は、現在開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際学会「SC21」において、11月17日付(日本時間11月18日)でMLPerf HPC v1.0として発表されました。
「MLPerf HPC」は、宇宙の発展や構造の研究で用いる指標の一つである宇宙論的パラメータを予測する「CosmoFlow」と、異常気象現象を特定する「DeepCAM(注6)」、触媒表面での分子の反応の様子を推定する「Open Catalyst(注7)」の三つのベンチマーク・プログラムのそれぞれにおいて性能を競うものです。このうち「CosmoFlow」に対し、「富岳」の約半分の規模を用いて、複数の深層学習モデルを一定の予測精度まで学習させ、はじめに学習を開始したモデルの開始時刻から最後に学習を終えたモデルの終了時刻までを計測しスループット性能を評価しました。今回、「富岳」の並列処理性能をさらに引き出すため、複数の学習モデルを並行して処理する際に発生するCPU同士の通信の相互干渉を減らし、さらに、CPUとストレージ間でのデータの通信量を最適化する技術を「富岳」上のプログラムに適用しました。その結果、深層学習モデルを8時間16分で637個、1分あたりでは約1.29個を学習しました。
この結果は、「CosmoFlow」の同カテゴリに登録した全システムの計測値の中で第1位となり、他システムの性能と比較し約1.77倍の性能差をつけたことになります。これにより、「富岳」が機械学習を利用した大規模な科学技術計算の分野において世界最高レベルの性能を有していることが示されました。
理研と富士通は、今後、今回の計測にあたり開発した大規模機械学習処理を高速化するライブラリやAIフレームワークといったソフトウェアスタックを一般公開します。スーパーコンピュータを用いた大規模機械学習処理の知見を広く共有することで、シミュレーション結果の解析による、宇宙物理学をはじめとする科学技術上の新たな発見へつながることが期待できます。また、機械翻訳サービスなどで活用されている自然言語処理モデルのような他の大規模機械学習計算にも応用することで技術革新を加速し、社会的・科学的課題の解決に貢献します。
MLPerf HPCについて
「MLPerf HPC」は、機械学習アプリケーションを実行するシステムの性能リストを作成することを目的に、膨大な時間を要する大規模機械学習計算をスーパーコンピュータで行った際のシステム性能を評価するため、機械学習ベンチマークを実施するコミュニティである「MLCommons」によって2020年に策定された機械学習ベンチマークです。「MLPerf HPC」は、世界各国のスーパーコンピュータで利用されており、新たな業界標準として期待されています。
今回の「MLPerf HPC」はv1.0として、スーパーコンピュータを利用しなければならない大規模の機械学習性能を測定することを目的として、「CosmoFlow」、「DeepCAM」、「Open Catalyst」の3つのアプリケーションで性能評価が実施されました。また、今回から単位時間あたりの深層学習モデルの学習数を測定するベンチマークが新設されました。
すべての計測データは下記サイトにて公開されています。
関連リンク: https://mlcommons.org/
本リリースの詳細は下記をご参照ください。
https://pr.fujitsu.com/jp/news/2021/11/18-1.html
概要: 富士通株式会社
詳細は http://jp.fujitsu.com/ をご覧ください。
Copyright 2021 JCN Newswire. All rights reserved. www.jcnnewswire.com
「MLPerf HPC」は、単位時間あたりに深層学習モデルをいくつ学習できるか(スループット性能)を測定(注5)するもので、「富岳」の並列処理性能をさらに引き出すソフトウェア技術により、他システムの性能と比較し約1.77倍の処理速度を達成し、機械学習を利用した大規模な科学技術計算の分野において世界最高レベルの性能を有していることが示されました。
今回の結果は、現在開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際学会「SC21」において、11月17日付(日本時間11月18日)でMLPerf HPC v1.0として発表されました。
「MLPerf HPC」は、宇宙の発展や構造の研究で用いる指標の一つである宇宙論的パラメータを予測する「CosmoFlow」と、異常気象現象を特定する「DeepCAM(注6)」、触媒表面での分子の反応の様子を推定する「Open Catalyst(注7)」の三つのベンチマーク・プログラムのそれぞれにおいて性能を競うものです。このうち「CosmoFlow」に対し、「富岳」の約半分の規模を用いて、複数の深層学習モデルを一定の予測精度まで学習させ、はじめに学習を開始したモデルの開始時刻から最後に学習を終えたモデルの終了時刻までを計測しスループット性能を評価しました。今回、「富岳」の並列処理性能をさらに引き出すため、複数の学習モデルを並行して処理する際に発生するCPU同士の通信の相互干渉を減らし、さらに、CPUとストレージ間でのデータの通信量を最適化する技術を「富岳」上のプログラムに適用しました。その結果、深層学習モデルを8時間16分で637個、1分あたりでは約1.29個を学習しました。
この結果は、「CosmoFlow」の同カテゴリに登録した全システムの計測値の中で第1位となり、他システムの性能と比較し約1.77倍の性能差をつけたことになります。これにより、「富岳」が機械学習を利用した大規模な科学技術計算の分野において世界最高レベルの性能を有していることが示されました。
理研と富士通は、今後、今回の計測にあたり開発した大規模機械学習処理を高速化するライブラリやAIフレームワークといったソフトウェアスタックを一般公開します。スーパーコンピュータを用いた大規模機械学習処理の知見を広く共有することで、シミュレーション結果の解析による、宇宙物理学をはじめとする科学技術上の新たな発見へつながることが期待できます。また、機械翻訳サービスなどで活用されている自然言語処理モデルのような他の大規模機械学習計算にも応用することで技術革新を加速し、社会的・科学的課題の解決に貢献します。
MLPerf HPCについて
「MLPerf HPC」は、機械学習アプリケーションを実行するシステムの性能リストを作成することを目的に、膨大な時間を要する大規模機械学習計算をスーパーコンピュータで行った際のシステム性能を評価するため、機械学習ベンチマークを実施するコミュニティである「MLCommons」によって2020年に策定された機械学習ベンチマークです。「MLPerf HPC」は、世界各国のスーパーコンピュータで利用されており、新たな業界標準として期待されています。
今回の「MLPerf HPC」はv1.0として、スーパーコンピュータを利用しなければならない大規模の機械学習性能を測定することを目的として、「CosmoFlow」、「DeepCAM」、「Open Catalyst」の3つのアプリケーションで性能評価が実施されました。また、今回から単位時間あたりの深層学習モデルの学習数を測定するベンチマークが新設されました。
すべての計測データは下記サイトにて公開されています。
関連リンク: https://mlcommons.org/
本リリースの詳細は下記をご参照ください。
https://pr.fujitsu.com/jp/news/2021/11/18-1.html
概要: 富士通株式会社
詳細は http://jp.fujitsu.com/ をご覧ください。
Copyright 2021 JCN Newswire. All rights reserved. www.jcnnewswire.com