パナソニックHD、多様な画像特徴を滑らかに捉える画像分類AIを開発
[23/12/25]
提供元:PRTIMES
提供元:PRTIMES
[画像: https://prtimes.jp/i/3442/5502/resize/d3442-5502-d0b98e4e00c254ea56a5-0.jpg ]
パナソニック ホールディングス株式会社(以下、パナソニックHD)は、従来のAIが苦手とする「種類や撮影条件によって同一カテゴリ内の見た目が多様になる」場合にも、精度良く画像認識が可能なAI技術を開発しました。
画像認識AIは、画像中の物体の特徴を捉えカテゴリを分類することで物体の認識を実現します。一方、「電車」「犬」など同じカテゴリに属しても、車種や犬種などのサブカテゴリ間で見た目が大きく異なる例も少なくありません。さらに同じ物体でも、向き・天候・光の当たり具合・背景など撮影条件の違いにより見た目が異なる例も多く、この見えの多様性をどう扱うかが、課題になっています。そこで従来はサブカテゴリ内の類似性や同一カテゴリに共通する特徴を見つけられるよう分類アルゴリズムを工夫することで、多様性に左右されず頑健に認識することを目指す研究が行われていました。しかしながら、様々な現場でAIの展開が進み、大量の多様な画像を扱うようになると、「共通する特徴を見つける」というアプローチでは、特に同一カテゴリ内に「見えの傾向が異なる、より細かいカテゴリ」が存在する場合(多峰性分布)、それらをうまく同じカテゴリの物体として推定できなくなり、認識精度の低下をもたらすことが知られています。
そこでパナソニックHDは、見えの違いを敢えて生かすことに着目し、2次元の正規直交行列により画像の多様性を捉える分類アルゴリズムを新たに開発しました。ベンチマークデータセットを用いた実証実験(*1)では、AIが苦手とする「多峰性分布」のデータに対しても高精度に画像分類を行えることを実証しました。
本技術は、パナソニックグループのトップ人材育成プログラムREAL-AI(*2)の研究成果として、2024年1月4日から2024年1月8日に米国ハワイで開催されるコンピュータビジョン分野のトップカンファレンスIEEE/CVF Winter Conference on Applications of Computer Vision (WACV 2024)で発表します。
パナソニックHDは、社会実装を加速するAI技術の研究・開発とAIトップ人材の育成を通して、お客様のくらしやしごとの現場へのお役立ちに貢献していきます。
*1 画像認識のベンチマークデータセットであるCIFAR-10/100、ImageNetに対するクラス分類タスク。
*2 先端技術の素早い事業展開と価値創出を行うトップ人材の育成により、パナソニックグループの先端AI研究開発を牽引するべく全社横断で組織された社内研究グループ。立命館大学教授でパナソニックHDの社員でもある谷口 忠大教授や、中部大学 山下 隆義教授の指導のもと、若手からエキスパートまで多くのメンバーがトップカンファレンスへ挑戦し、これまで多数の研究が採択されている。
全文は以下プレスリリースをご覧ください。
▼[プレスリリース]パナソニックHD、多様な画像特徴を滑らかに捉える画像分類AIを開発(2023年12月25日)
https://news.panasonic.com/jp/press/jn231225-3
<関連情報>
・論文情報
https://openaccess.thecvf.com/content/WACV2024/html/Goto_Learning_Intra-Class_Multimodal_Distributions_With_Orthonormal_Matrices_WACV_2024_paper.html
・WACV 2024 公式サイト
https://wacv2024.thecvf.com/
・Panasonic×AI WEBサイト
https://tech-ai.panasonic.com/jp/
・Panasonic×AI X
https://twitter.com/panasonic_ai