ポストコロナ社会を見据えたコミュニケーションツール向けAPIを提供開始
[20/05/01]
提供元:PRTIMES
提供元:PRTIMES
話者認識APIのβ版提供を開始
株式会社QuantumCore(クアンタムコア、本社:東京都品川区、代表取締役:秋吉信吾、以下「当社」)は、レザバーコンピューティングを基にした多変量時系列処理ソリューション「Qore」を活用し、話者認識API「VDQore」のβ版提供を開始しました
■話者認識API「VDQore」
AIスピーカー、議事録、コールセンターなど様々な分野で音声認識の技術が利用され始めていますが、発話者の声から個人を特定させる話者認識の技術は未だ簡単に利用できません。当社は、10秒程度の音声を2秒程度の時間で学習し、言語や利用環境に依存せずリアルタイムに精度97%で話者認識ができるVDQore(ブイディーコア)のAPI提供を開始しました。
[画像: https://prtimes.jp/i/39630/10/resize/d39630-10-235449-0.png ]
人間の声にはそれぞれ特徴があり、発言者の声から個人を特定する技術は既に存在しますが、個人から取れるデータは少ないため、高精度な認識モデルの作成が難しい課題があります。市場で利用できるソリューションには、人数分の高価な専用マイクが必要、数分程度の音声登録が必要、対応言語が限定、発言者は3名までに限定等があり、簡単に利用することは未だ難しいです。そのため、人々の生活が日々変化する中で、状況に合わせた利用が求められています。
当社は、レザバーコンピューティングを基にした多変量時系列処理ソリューション「Qore」(コア)を活用した話者認識API「VDQore」の提供で、生活に身近な技術の提供を行います。既存の音声認識技術と組み合わせて「誰」が「何」を話したかを可視化させることで、ビックデータによる作りきりのモデルではなく、個人や環境へ柔軟に対応させながら利用し、人に寄り添う技術の提供を実現します。既に大手パートナー企業様での利用も開始され、今回のβ版公開により、新型コロナウイルスの影響で事業形態に変化が起きる業種でも、状況に合わせた柔軟で迅速な対応を支援します。特に、従業員やお客様とのコミュニケーション可視化の支援にも繋がります。
■活用事例
議事録システム:Webや対面会議おいて、参加者の発言内容を正確に可視化させ、業務効率の向上
コールセンター:お客様との会話において、問い合わせ内容を正確に把握したり、対応方法の改善抽出
AIスピーカー:家族で集まるリビングにおいて、特定の人物だけの声に反応してAIスピーカーが起動したり、人物毎に反応方法やコンテンツを入れ替える
■性能・スペック
音声データ:従来は数分間話し続けた声や人数分の専用マイクが必要ですが、VDQoreは自己紹介程度(約10秒)の音声を、一般的なマイク(スマホ・PCのマイク)で利用場面毎に録音するだけで動作し、言語依存も無いため柔軟な利用方法が可能です。
登録(学習):従来は音声登録に数分程度(深層学習・LSTM)の時間が必要ですが、VDQoreは約2秒(AWSマイクロインスタンス利用)で行えるため、用途に合わせて一瞬で登録が行えます。
動作:REST API方式で接続し、精度97%で話者認識を実行(当社調べ)
■お申し込み
β版のご利用を希望される場合は、以下メールアドレスへお問い合わせください。新型コロナウイルス(COVID-19)対策の方は優先的に対応いたしますので、その旨を記載ください。
お問合せ:info@qcore.co.jp
株式会社QuantumCore(クアンタムコア、本社:東京都品川区、代表取締役:秋吉信吾、以下「当社」)は、レザバーコンピューティングを基にした多変量時系列処理ソリューション「Qore」を活用し、話者認識API「VDQore」のβ版提供を開始しました
■話者認識API「VDQore」
AIスピーカー、議事録、コールセンターなど様々な分野で音声認識の技術が利用され始めていますが、発話者の声から個人を特定させる話者認識の技術は未だ簡単に利用できません。当社は、10秒程度の音声を2秒程度の時間で学習し、言語や利用環境に依存せずリアルタイムに精度97%で話者認識ができるVDQore(ブイディーコア)のAPI提供を開始しました。
[画像: https://prtimes.jp/i/39630/10/resize/d39630-10-235449-0.png ]
人間の声にはそれぞれ特徴があり、発言者の声から個人を特定する技術は既に存在しますが、個人から取れるデータは少ないため、高精度な認識モデルの作成が難しい課題があります。市場で利用できるソリューションには、人数分の高価な専用マイクが必要、数分程度の音声登録が必要、対応言語が限定、発言者は3名までに限定等があり、簡単に利用することは未だ難しいです。そのため、人々の生活が日々変化する中で、状況に合わせた利用が求められています。
当社は、レザバーコンピューティングを基にした多変量時系列処理ソリューション「Qore」(コア)を活用した話者認識API「VDQore」の提供で、生活に身近な技術の提供を行います。既存の音声認識技術と組み合わせて「誰」が「何」を話したかを可視化させることで、ビックデータによる作りきりのモデルではなく、個人や環境へ柔軟に対応させながら利用し、人に寄り添う技術の提供を実現します。既に大手パートナー企業様での利用も開始され、今回のβ版公開により、新型コロナウイルスの影響で事業形態に変化が起きる業種でも、状況に合わせた柔軟で迅速な対応を支援します。特に、従業員やお客様とのコミュニケーション可視化の支援にも繋がります。
■活用事例
議事録システム:Webや対面会議おいて、参加者の発言内容を正確に可視化させ、業務効率の向上
コールセンター:お客様との会話において、問い合わせ内容を正確に把握したり、対応方法の改善抽出
AIスピーカー:家族で集まるリビングにおいて、特定の人物だけの声に反応してAIスピーカーが起動したり、人物毎に反応方法やコンテンツを入れ替える
■性能・スペック
音声データ:従来は数分間話し続けた声や人数分の専用マイクが必要ですが、VDQoreは自己紹介程度(約10秒)の音声を、一般的なマイク(スマホ・PCのマイク)で利用場面毎に録音するだけで動作し、言語依存も無いため柔軟な利用方法が可能です。
登録(学習):従来は音声登録に数分程度(深層学習・LSTM)の時間が必要ですが、VDQoreは約2秒(AWSマイクロインスタンス利用)で行えるため、用途に合わせて一瞬で登録が行えます。
動作:REST API方式で接続し、精度97%で話者認識を実行(当社調べ)
■お申し込み
β版のご利用を希望される場合は、以下メールアドレスへお問い合わせください。新型コロナウイルス(COVID-19)対策の方は優先的に対応いたしますので、その旨を記載ください。
お問合せ:info@qcore.co.jp