世界初!3Dキャラクターと音声で会話!名工大「双方向音声案内デジタルサイネージ」を開発
名古屋工業大学は世界初の双方向音声案内デジタルサイネージを開発し、大学の正門付近に設置しました。
70インチの大型ディスプレイ2面を備え、訪問者が知りたい情報を音声でたずねると、等身大の3Dキャラクター
「メイちゃん」がまるで生きているかのようにジェスチャーやパネル表示を交えて音声で案内します。
70インチの大型ディスプレイ2面を備え、訪問者が知りたい情報を音声でたずねると、等身大の3Dキャラクター
「メイちゃん」がまるで生きているかのようにジェスチャーやパネル表示を交えて音声で案内します。
名工大国際音声技術研究所、「双方向音声案内デジタルサイネージ」を開発
〜世界初!3Dキャラクターと音声で会話!〜
国立大学法人名古屋工業大学(名古屋市昭和区 学長:高橋 実)は、同大学
国際音声技術研究所(代表:徳田恵一教授)が開発した世界初の
双方向音声案内デジタルサイネージを同校正門正面に設置いたしました。
2面の大型ディスプレイの右側には等身大の3D キャラクター「メイちゃん」、
左側には案内コンテンツが表示され、訪問者が画面のキャラクターに
聞きたい情報を音声でたずねると、それがまるで生きているかのように
ジェスチャーやパネル表示を交えて音声で案内します。
本デジタルサイネージは、同大学の国際音声技術研究所がオープンソースで
公開しているソフトウェアである
「音声インタラクションシステム構築ツールキットMMDAgent」を基盤技術
として、同大学の情報基盤センターの協力のもと開発されました。
「双方向音声案内デジタルサイネージ」の特徴
1. 同研究所で長年にわたり開発・公開している音声合成ツールキットHTS、
音声認識エンジンJulius他をベースに独自開発した最先端の
音声合成・認識技術を高度に統合しており、高速で高精度、かつ表情豊かな
会話を実現しています。
2. キャラクター表示部は、OpenGLを用いた3次元による高度な描画機能を
有しており、トゥーンレンダリングやシャドウマップ法を駆使したリアルな
3D描画や物理エンジンを用いたリアルな表現を実現しています。
3. 「MMDAgent」はオープンソースのソフトウェアとして公開しており、
3Dキャラクターモデル等の各種データ形式はオープンな仕様となっています。
4. 複数のカメラを用いた顔画像認識技術によるキャラクターの視線制御や、
焦電センサーを用いた人体検知により、キャラクター側からの能動的な
呼びかけを行います。
5. 表示テキストや画像、発話テキストに加えて、案内時のキャラクターの
モーションや発話スタイルまでも統合したコンテンツを、サーバーから
動的に更新し、情報基盤センターのデータベースに登録された
学内イベント情報の中から、季節や時間、内容に応じて適切に取捨選択
された情報がタイムリーに案内されます。
6. デジタルサイネージ部には70 インチ超高輝度液晶(2000 カンデラ)
2 面を用い、国内最高レベルの輝度を実現しています。
(システム開発は鉄道系、流通系デジタルサイネージで多くの設置運営実績を
持つコンテンツ配信システム開発企業の株式会社ブイシンク
(東京都中央区 代表取締役社長:井部 孝也)が協力しました。)
名古屋工業大学国際音声技術研究所は、名古屋工業大学大学内に設置された
プロジェクト研究所であり、同大学の徳田・李研究室が中心となって
音声言語処理に関する国際的な研究プロジェクトに取り組んでいます。
音声技術に関連したトップレベルの研究成果をオープンソースソフトウェア
の形で積極的に公開し続けています。
【デモ動画】
・YouTube: http://www.youtube.com/watch?v=hGiDMVakggE
・ニコニコ動画: http://www.nicovideo.jp/watch/sm12181530
【お問い合わせ】
名古屋工業大学 広報室
竹内辰巳
052-735-5004
Takeuchi.tatsumi@ict.nitech.ac.jp
名古屋工業大学 国際音声技術研究所
徳田恵一
054-735-5479/080-3733-4630
tokuda@nitech.ac.jp
名古屋工業大学 情報基盤センター
内匠 逸
054-735-5472
takumi@nitech.ac.jp
株式会社ブイシンク 事業開発本部
加藤義弘
03-3544-4700
kato@v-sync.co.jp
〜世界初!3Dキャラクターと音声で会話!〜
国立大学法人名古屋工業大学(名古屋市昭和区 学長:高橋 実)は、同大学
国際音声技術研究所(代表:徳田恵一教授)が開発した世界初の
双方向音声案内デジタルサイネージを同校正門正面に設置いたしました。
2面の大型ディスプレイの右側には等身大の3D キャラクター「メイちゃん」、
左側には案内コンテンツが表示され、訪問者が画面のキャラクターに
聞きたい情報を音声でたずねると、それがまるで生きているかのように
ジェスチャーやパネル表示を交えて音声で案内します。
本デジタルサイネージは、同大学の国際音声技術研究所がオープンソースで
公開しているソフトウェアである
「音声インタラクションシステム構築ツールキットMMDAgent」を基盤技術
として、同大学の情報基盤センターの協力のもと開発されました。
「双方向音声案内デジタルサイネージ」の特徴
1. 同研究所で長年にわたり開発・公開している音声合成ツールキットHTS、
音声認識エンジンJulius他をベースに独自開発した最先端の
音声合成・認識技術を高度に統合しており、高速で高精度、かつ表情豊かな
会話を実現しています。
2. キャラクター表示部は、OpenGLを用いた3次元による高度な描画機能を
有しており、トゥーンレンダリングやシャドウマップ法を駆使したリアルな
3D描画や物理エンジンを用いたリアルな表現を実現しています。
3. 「MMDAgent」はオープンソースのソフトウェアとして公開しており、
3Dキャラクターモデル等の各種データ形式はオープンな仕様となっています。
4. 複数のカメラを用いた顔画像認識技術によるキャラクターの視線制御や、
焦電センサーを用いた人体検知により、キャラクター側からの能動的な
呼びかけを行います。
5. 表示テキストや画像、発話テキストに加えて、案内時のキャラクターの
モーションや発話スタイルまでも統合したコンテンツを、サーバーから
動的に更新し、情報基盤センターのデータベースに登録された
学内イベント情報の中から、季節や時間、内容に応じて適切に取捨選択
された情報がタイムリーに案内されます。
6. デジタルサイネージ部には70 インチ超高輝度液晶(2000 カンデラ)
2 面を用い、国内最高レベルの輝度を実現しています。
(システム開発は鉄道系、流通系デジタルサイネージで多くの設置運営実績を
持つコンテンツ配信システム開発企業の株式会社ブイシンク
(東京都中央区 代表取締役社長:井部 孝也)が協力しました。)
名古屋工業大学国際音声技術研究所は、名古屋工業大学大学内に設置された
プロジェクト研究所であり、同大学の徳田・李研究室が中心となって
音声言語処理に関する国際的な研究プロジェクトに取り組んでいます。
音声技術に関連したトップレベルの研究成果をオープンソースソフトウェア
の形で積極的に公開し続けています。
【デモ動画】
・YouTube: http://www.youtube.com/watch?v=hGiDMVakggE
・ニコニコ動画: http://www.nicovideo.jp/watch/sm12181530
【お問い合わせ】
名古屋工業大学 広報室
竹内辰巳
052-735-5004
Takeuchi.tatsumi@ict.nitech.ac.jp
名古屋工業大学 国際音声技術研究所
徳田恵一
054-735-5479/080-3733-4630
tokuda@nitech.ac.jp
名古屋工業大学 情報基盤センター
内匠 逸
054-735-5472
takumi@nitech.ac.jp
株式会社ブイシンク 事業開発本部
加藤義弘
03-3544-4700
kato@v-sync.co.jp