クーガーのAIチームが世界的権威のあるAIコンペティションで世界2位に入賞し、国際学会に論文採択
[20/06/29]
提供元:PRTIMES
提供元:PRTIMES
サーモグラフィー画像は写真のような画像データとは異なり、周囲の光や影の影響を受けず、透過性に優れ、熱を検知できるといった特徴から、医療・軍事・物体検出など幅広い分野で利用されています。一般的に解像度が低いサーモグラフィー画像を高解像度化するAIモデルについて新たなアプローチで競い合うコンペティションが、世界最大の電気工学・電子工学技術の学会であるIEEEによって主催されました。このコンペにおいてクーガー社員2名によるAIモデルが2位を獲得。コンピュータービジョンの世界トップカンファレンス「CVPR」において両名による同AIモデルについての論文が採択されました。
[画像1: https://prtimes.jp/i/33615/22/resize/d33615-22-299723-0.png ]
クーガー株式会社(本社: 東京都渋谷区、代表取締役CEO: 石井敦、以下「クーガー」)は、世界最大の電気工学・電子工学技術の学会であるIEEE(アイトリプルイー)が主催するコンペティション「Thermal Image Super-Resolution Challenge」において弊社のDevanathan Sabarinathan氏とDr. Priya Kansal氏が2位に入賞し、コンピュータービジョンのトップカンファレンスであるCVPRに論文が採択されたことをお知らせいたします。
IEEE PBVS’20 Thermal Image Super-Resolution Challenge
http://vcipl-okstate.org/pbvs/20/challenge.html
本論文は、異なるカメラから取得した一対となったサーモグラフィー画像から、機械学習を通じて、高解像度の画像を生成するための手法に関するものです。
概要
世界中でのデータ爆発に伴い、AIの研究および社会実装は急速に進められています。AI時代において、様々な状況に対応できる精度の高い自動化を実現するための応用手法が、日々試行錯誤されています。その応用領域の一つに、今回のコンぺティションのテーマとなったサーモグラフィー画像の高解像度解析があります。
サーモグラフィー画像は写真のような画像データとは異なり、周囲の光や影の影響を受けず、透過性に優れ、熱を検知できるといった特徴から、医療・軍事・物体検出など幅広い分野で利用されています。例えば、空港で熱がある患者を見分けることでウィルス感染の拡散を防いだり、物体が見えにくくなる夜間の運転時に人を検知することで事故を防ぐといったことが挙げられます。
一般的にサーモグラフィー画像は解像度が低いため、従来は、データの前処理を行い、ノイズやぼかしを加えるといった手法を用いた高解像度への対応が行われていました。一方、異なるカメラから得られた一対の画像(低解像度画像と高解像度画像)を用いて学習を行うという手法はほとんどありませんでした。今回は、この一対の画像データをもとにした新しい機械学習手法に関する、コンぺティションが開催されました。
2位に入賞したクーガーの手法について
[画像2: https://prtimes.jp/i/33615/22/resize/d33615-22-608481-6.png ]
論文で提案したアプローチは、畳み込み層、残差接続、アテンションモジュールを利用したMulti-Level Supervisionモデルと呼ばれる深層畳み込みニューラルネットワークをベースとしたアプローチです。また、これまで一般的に使われてきた手法よりも高い精度を記録しています。この手法は、次の点で優れています。
- 多階層のため、1つのモデルで3つの異なるスケール(x2, x3, x4)の高解像化タスクを扱うことができる。
- 残差接続を利用することで失われた情報に焦点を当てるため、複雑性が低い。
- 畳み込み層、残差学習、CBAM(Convolutional Block Attention Module)を利用して空間情報を保持することで、このモデルのロバスト性(*1)を向上させることができる。
[画像3: https://prtimes.jp/i/33615/22/resize/d33615-22-637974-1.jpg ]
クーガーが提案したアーキテクチャーはコンペティション内のデータセットでの結果だけでなく、他のデータセットでも同レベルの性能を実現できることが示されています。
現状のサーモグラフィー装置は高価であり、企業にとって導入のハードルが高いといった課題があります。安価な装置から取得した低解像度画像でも、機械学習を通じて高解像度化を可能とすることで、AIの社会実装レベルを引き上げていくことが期待できます。
論文を執筆したクーガーのDevanathan Sabarinathan氏とDr. Priya Kansal氏は、過去にもFacebook社の主催するアイトラッキングコンペティションでの3位入賞やCVPR2019でも骨格推定に関する論文が採択されるなど、コンピュータービジョン領域で多くの実績を残しております。こうした研究開発をもとに、クーガーは人間を深く理解する人型AI「バーチャルヒューマンエージェント」への応用を進めてまいります。クーガーでは今後も、新技術の社会実装を目指し、引き続きサービス提供と研究開発を進めてまいります。
●IEEEについて
IEEE(Institute of Electrical and Electronics Engineers)は、アメリカ合衆国に本部を持つ、世界最大の学術研究団体です。対象となる範囲はコンピュータや持続可能なエネルギーシステム、航空宇宙、コミュニケーション、ロボット工学、ヘルスケア等多岐に渡り、世界160ヵ国以上に42万人を超える会員によって構成されています。
●クーガー株式会社
AI・IoT・AR/VR・ブロックチェーンを組み合わせた人型AI「バーチャルヒューマンエージェント」の開発を進めています。世界トップカンファレンスへのAI技術の論文採択やゲーム開発実績など、幅広い分野の技術開発に取り組んでいます。
会社HP:https://couger.co.jp/
*1 : ロバスト性
ロバスト性とは、ある系が応力や環境の変化といった外乱の影響によって変化することを阻止する内的な仕組み、または性質をいう。
[画像1: https://prtimes.jp/i/33615/22/resize/d33615-22-299723-0.png ]
クーガー株式会社(本社: 東京都渋谷区、代表取締役CEO: 石井敦、以下「クーガー」)は、世界最大の電気工学・電子工学技術の学会であるIEEE(アイトリプルイー)が主催するコンペティション「Thermal Image Super-Resolution Challenge」において弊社のDevanathan Sabarinathan氏とDr. Priya Kansal氏が2位に入賞し、コンピュータービジョンのトップカンファレンスであるCVPRに論文が採択されたことをお知らせいたします。
IEEE PBVS’20 Thermal Image Super-Resolution Challenge
http://vcipl-okstate.org/pbvs/20/challenge.html
本論文は、異なるカメラから取得した一対となったサーモグラフィー画像から、機械学習を通じて、高解像度の画像を生成するための手法に関するものです。
概要
世界中でのデータ爆発に伴い、AIの研究および社会実装は急速に進められています。AI時代において、様々な状況に対応できる精度の高い自動化を実現するための応用手法が、日々試行錯誤されています。その応用領域の一つに、今回のコンぺティションのテーマとなったサーモグラフィー画像の高解像度解析があります。
サーモグラフィー画像は写真のような画像データとは異なり、周囲の光や影の影響を受けず、透過性に優れ、熱を検知できるといった特徴から、医療・軍事・物体検出など幅広い分野で利用されています。例えば、空港で熱がある患者を見分けることでウィルス感染の拡散を防いだり、物体が見えにくくなる夜間の運転時に人を検知することで事故を防ぐといったことが挙げられます。
一般的にサーモグラフィー画像は解像度が低いため、従来は、データの前処理を行い、ノイズやぼかしを加えるといった手法を用いた高解像度への対応が行われていました。一方、異なるカメラから得られた一対の画像(低解像度画像と高解像度画像)を用いて学習を行うという手法はほとんどありませんでした。今回は、この一対の画像データをもとにした新しい機械学習手法に関する、コンぺティションが開催されました。
2位に入賞したクーガーの手法について
[画像2: https://prtimes.jp/i/33615/22/resize/d33615-22-608481-6.png ]
論文で提案したアプローチは、畳み込み層、残差接続、アテンションモジュールを利用したMulti-Level Supervisionモデルと呼ばれる深層畳み込みニューラルネットワークをベースとしたアプローチです。また、これまで一般的に使われてきた手法よりも高い精度を記録しています。この手法は、次の点で優れています。
- 多階層のため、1つのモデルで3つの異なるスケール(x2, x3, x4)の高解像化タスクを扱うことができる。
- 残差接続を利用することで失われた情報に焦点を当てるため、複雑性が低い。
- 畳み込み層、残差学習、CBAM(Convolutional Block Attention Module)を利用して空間情報を保持することで、このモデルのロバスト性(*1)を向上させることができる。
[画像3: https://prtimes.jp/i/33615/22/resize/d33615-22-637974-1.jpg ]
クーガーが提案したアーキテクチャーはコンペティション内のデータセットでの結果だけでなく、他のデータセットでも同レベルの性能を実現できることが示されています。
現状のサーモグラフィー装置は高価であり、企業にとって導入のハードルが高いといった課題があります。安価な装置から取得した低解像度画像でも、機械学習を通じて高解像度化を可能とすることで、AIの社会実装レベルを引き上げていくことが期待できます。
論文を執筆したクーガーのDevanathan Sabarinathan氏とDr. Priya Kansal氏は、過去にもFacebook社の主催するアイトラッキングコンペティションでの3位入賞やCVPR2019でも骨格推定に関する論文が採択されるなど、コンピュータービジョン領域で多くの実績を残しております。こうした研究開発をもとに、クーガーは人間を深く理解する人型AI「バーチャルヒューマンエージェント」への応用を進めてまいります。クーガーでは今後も、新技術の社会実装を目指し、引き続きサービス提供と研究開発を進めてまいります。
●IEEEについて
IEEE(Institute of Electrical and Electronics Engineers)は、アメリカ合衆国に本部を持つ、世界最大の学術研究団体です。対象となる範囲はコンピュータや持続可能なエネルギーシステム、航空宇宙、コミュニケーション、ロボット工学、ヘルスケア等多岐に渡り、世界160ヵ国以上に42万人を超える会員によって構成されています。
●クーガー株式会社
AI・IoT・AR/VR・ブロックチェーンを組み合わせた人型AI「バーチャルヒューマンエージェント」の開発を進めています。世界トップカンファレンスへのAI技術の論文採択やゲーム開発実績など、幅広い分野の技術開発に取り組んでいます。
会社HP:https://couger.co.jp/
*1 : ロバスト性
ロバスト性とは、ある系が応力や環境の変化といった外乱の影響によって変化することを阻止する内的な仕組み、または性質をいう。