選択した場所の風景やアップロードした画像にAIがピッタリくる音をその場で探してくれるウェブサービス『Imaginary Soundscape』の最新版が公開
[22/04/28]
提供元:PRTIMES
提供元:PRTIMES
モデルとサウンドライブラリーを拡張した高精度エンジンをライセンス販売
AIの活用による創造性の発展に取り組む株式会社Qosmo(本社:東京都目黒区、代表取締役社長:徳井直生、以下「コズモ」)は、マルチモーダル深層学習技術を応用した自社アルゴリズムを活用し、入力された画像に適切なサウンドクリップを見つけてくれるウェブサービス、『Imaginary Soundscape』(イマジナリー・サウンドスケープ)の最新バージョンを日英両言語にて無料公開しました。また、本サービスのコア技術である「Img2Sound(イメージtoサウンド)」エンジンのライセンス提供を開始しました。本製品は5月11日〜13日に東京ビッグサイトで予定されている第6回 AI・人工知能EXPO【春】のQosmoブースに出展予定です。
・Imaginary Soundscape ウェブサイト:https://www.imaginarysoundscape.net/
[画像1: https://prtimes.jp/i/63351/9/resize/d63351-9-af06fd3619ee2a7eefb4-0.png ]
Imaginary Soundscapeとは
人は一枚の風景写真から、例えば海辺の写真からはさざなみの音を、渋谷のスクランブル交差点の写真からは信号の音など、その場にいたら聞こえるであろう音を想像することがあります。本プロジェクトでは、そのように人が無意識にも想像する行為を、AIを使って外部化したウェブサービスです。ユーザーが選択した画像に基づき、6万個以上のサウンドクリップを含む音声ライブラリーの中からAIが最も合っている音を選び出します。また、Googleストリートビューモードでは、世界中のどこでも好きな場所を歩き回りながら、AIがその場で「想像した」サウンドスケープを体感することができます。本プロジェクトは2017年の開始以来高い注目を集め、これまでに全世界から50万人近くのユーザー様にご利用を頂いています。
[画像2: https://prtimes.jp/i/63351/9/resize/d63351-9-5b84f31b6ef0da0af4a4-1.png ]
最新版でアップデートされた機能
今回のアップデートにおいては、モデル精度の向上、音声データベースの拡充、UIの向上の3つの変更を加えました。識別モデルをベースにしたモデルから、コントラスティブ学習によるマルチモーダルなモデルに変更しました。また、マッチングの対象となるサウンドデータのライブラリを大幅に拡充しています。これにより今までよりも多様なニュアンスの違いに対してマッチングの感度を高めることができました。
また、初めて利用するユーザー様にも親しみやすいようにインターフェースを向上し、これまでの英語表記に加え、日本語の翻訳も付け加えました。
「Img2Sound(イメージtoサウンド)」エンジンのライセンス提供
この度の新バージョンの開発完了により、本技術の完成度が一定水準に達したことを受け、Imaginary Soundscapeのコア技術である「Img2Sound(イメージtoサウンド)」エンジンのライセンス提供を開始しました。
Img2Sound(イメージtoサウンド)エンジンは、深層学習アルゴリズムによって構築された、画像と音声のそれぞれを多次元の抽象的なベクトル表現に置き換えるための事前学習モデルから構成されます。関連性の高い画像と音声がマッチングされるよう、この2つのベクトル空間をコントラスティブ学習(Contrastive Learning)と言われる手法を応用した比較学習を行うことで、異なる2種類のモダリティー(ここでは画像と音)の類似性を定量化することを可能にしています。本技術はテキストと音、ビデオと音、など様々な種類のメディアを関連付ける事ができる応用性の高い技術となっており、これまでにも弊社ではクライアント企業様の製品・サービス・プロジェクトへのマルチモーダルAI技術の導入支援を行ってきました。
・Imaginary Soundscape 技術解説ページ(旧バージョン技術に関してのみ記載、近日アップデート予定):https://qosmo.jp/projects/imaginarysoundscape/
[画像3: https://prtimes.jp/i/63351/9/resize/d63351-9-a020a76676ca6591b7d8-4.png ]
過去の作品展示・受賞履歴
[表: https://prtimes.jp/data/corp/63351/table/9_1_d80953adf0e5dd2ab3f09d6f32cd33a5.jpg ]
AI Expo2022春にて展示予定
コズモは、5月11日〜13日に東京ビッグサイトで開催される第6回 AI・人工知能EXPO【春】に出展予定です。本作品及び他の音楽・音関連の最新技術を体感いただける展示を予定しておりますので、ぜひお立ち寄りください!
■株式会社Qosmo(コズモ)
[画像4: https://prtimes.jp/i/63351/9/resize/d63351-9-7512e325144ef8967e09-3.jpg ]
2009年設立。「アートとテクノロジーを通じて人類の創造性を拡張する」をビジョンに掲げる。アーティスト、研究者、プログラマ、デザイナーから構成されるチームが、作品制作を通して創造性のフロンティアを切り開くとともに、アーティスト・企業・個人が使えるAIツールを提供することでより寄多くの人が創造的に働き・学び・暮らせる社会の構築に与することをミッションに活動する。https://qosmo.jp
AIの活用による創造性の発展に取り組む株式会社Qosmo(本社:東京都目黒区、代表取締役社長:徳井直生、以下「コズモ」)は、マルチモーダル深層学習技術を応用した自社アルゴリズムを活用し、入力された画像に適切なサウンドクリップを見つけてくれるウェブサービス、『Imaginary Soundscape』(イマジナリー・サウンドスケープ)の最新バージョンを日英両言語にて無料公開しました。また、本サービスのコア技術である「Img2Sound(イメージtoサウンド)」エンジンのライセンス提供を開始しました。本製品は5月11日〜13日に東京ビッグサイトで予定されている第6回 AI・人工知能EXPO【春】のQosmoブースに出展予定です。
・Imaginary Soundscape ウェブサイト:https://www.imaginarysoundscape.net/
[画像1: https://prtimes.jp/i/63351/9/resize/d63351-9-af06fd3619ee2a7eefb4-0.png ]
Imaginary Soundscapeとは
人は一枚の風景写真から、例えば海辺の写真からはさざなみの音を、渋谷のスクランブル交差点の写真からは信号の音など、その場にいたら聞こえるであろう音を想像することがあります。本プロジェクトでは、そのように人が無意識にも想像する行為を、AIを使って外部化したウェブサービスです。ユーザーが選択した画像に基づき、6万個以上のサウンドクリップを含む音声ライブラリーの中からAIが最も合っている音を選び出します。また、Googleストリートビューモードでは、世界中のどこでも好きな場所を歩き回りながら、AIがその場で「想像した」サウンドスケープを体感することができます。本プロジェクトは2017年の開始以来高い注目を集め、これまでに全世界から50万人近くのユーザー様にご利用を頂いています。
[画像2: https://prtimes.jp/i/63351/9/resize/d63351-9-5b84f31b6ef0da0af4a4-1.png ]
最新版でアップデートされた機能
今回のアップデートにおいては、モデル精度の向上、音声データベースの拡充、UIの向上の3つの変更を加えました。識別モデルをベースにしたモデルから、コントラスティブ学習によるマルチモーダルなモデルに変更しました。また、マッチングの対象となるサウンドデータのライブラリを大幅に拡充しています。これにより今までよりも多様なニュアンスの違いに対してマッチングの感度を高めることができました。
また、初めて利用するユーザー様にも親しみやすいようにインターフェースを向上し、これまでの英語表記に加え、日本語の翻訳も付け加えました。
「Img2Sound(イメージtoサウンド)」エンジンのライセンス提供
この度の新バージョンの開発完了により、本技術の完成度が一定水準に達したことを受け、Imaginary Soundscapeのコア技術である「Img2Sound(イメージtoサウンド)」エンジンのライセンス提供を開始しました。
Img2Sound(イメージtoサウンド)エンジンは、深層学習アルゴリズムによって構築された、画像と音声のそれぞれを多次元の抽象的なベクトル表現に置き換えるための事前学習モデルから構成されます。関連性の高い画像と音声がマッチングされるよう、この2つのベクトル空間をコントラスティブ学習(Contrastive Learning)と言われる手法を応用した比較学習を行うことで、異なる2種類のモダリティー(ここでは画像と音)の類似性を定量化することを可能にしています。本技術はテキストと音、ビデオと音、など様々な種類のメディアを関連付ける事ができる応用性の高い技術となっており、これまでにも弊社ではクライアント企業様の製品・サービス・プロジェクトへのマルチモーダルAI技術の導入支援を行ってきました。
・Imaginary Soundscape 技術解説ページ(旧バージョン技術に関してのみ記載、近日アップデート予定):https://qosmo.jp/projects/imaginarysoundscape/
[画像3: https://prtimes.jp/i/63351/9/resize/d63351-9-a020a76676ca6591b7d8-4.png ]
過去の作品展示・受賞履歴
[表: https://prtimes.jp/data/corp/63351/table/9_1_d80953adf0e5dd2ab3f09d6f32cd33a5.jpg ]
AI Expo2022春にて展示予定
コズモは、5月11日〜13日に東京ビッグサイトで開催される第6回 AI・人工知能EXPO【春】に出展予定です。本作品及び他の音楽・音関連の最新技術を体感いただける展示を予定しておりますので、ぜひお立ち寄りください!
■株式会社Qosmo(コズモ)
[画像4: https://prtimes.jp/i/63351/9/resize/d63351-9-7512e325144ef8967e09-3.jpg ]
2009年設立。「アートとテクノロジーを通じて人類の創造性を拡張する」をビジョンに掲げる。アーティスト、研究者、プログラマ、デザイナーから構成されるチームが、作品制作を通して創造性のフロンティアを切り開くとともに、アーティスト・企業・個人が使えるAIツールを提供することでより寄多くの人が創造的に働き・学び・暮らせる社会の構築に与することをミッションに活動する。https://qosmo.jp