自動『同時通訳』技術の研究開発コンソーシアムを設立〜官民の総力を挙げて『同時通訳』の自動化を実現〜
[20/08/28]
提供元:PRTIMES
提供元:PRTIMES
総務省が2020年度より新規に実施する情報通信技術の研究開発課題「多言語翻訳技術の高度化に関する研究開発」(※1)(以下「本研究開発」)の委託先として選定された凸版印刷株式会社、国立研究開発法人情報通信研究機構、マインドワード株式会社、株式会社インターグループ、ヤマハ株式会社、フェアリーデバイセズ株式会社の6団体に、社会実証を担当する団体(注)として東日本電信電話株式会社、ソースネクスト株式会社、株式会社KDDIテクノロジーの3団体を加え、合計9団体による「総務省委託・多言語翻訳技術高度化推進コンソーシアム」(以下「本コンソーシアム」)を8月28日に設立しました。本コンソーシアムは、グローバルコミュニケーション計画2025(2020年3月31日総務省)(※2)の推進のため、既に実用化されている『逐次通訳』の技術を『同時通訳』の技術にまで高度化し、ビジネス等の場面での利活用を可能にすることを目指します。
(注) 本研究開発では、通訳ニーズが高い実社会の複数の分野・場面での社会実証を通じて得られた知見をフィードバックしながら進めていくこととしており、グローバルコミュニケーション計画2025(2020年3月31日総務省)(※2)を参考に、有識者の意見も踏まえながら、社会実証すべき内容及び実施団体を選定したものです。
【背景】
日本社会の急速なグローバル化に伴い、ビジネスでの議論・交渉などの場面、国際イベントの場面など、リアルアイムでの意思疎通を可能とする同時通訳へのニーズが高まっています。このニーズに応えるため「自動の『同時通訳』システム」の実現が期待されています。
現在の音声翻訳技術は、発話者が一区切りの発話を完了したところで発話を停止し、一区切りの文章を通訳するものです(これを「逐次通訳」と呼びます)。これに対して、「同時通訳」は、話者の発話が終了する前から通訳者が発話の一部を訳出することを繰り返すものです。
同時通訳は、逐次通訳と比較して、発話内容が翻訳されて相手に伝わるまでの時間が短縮でき、さらに発話者が発話を中断する必要もない、という大きなメリットがあります。しかしながら、現在の音声翻訳技術は、同時通訳には対応しておらず、加えて、文脈などの補足情報も反映することができず、「人間の同時通訳」には遠く及びません。
本コンソーシアムでは、AIによる「同時通訳」技術の研究開発を行い、社会実装に向けた実証と改良を推進します。
【本コンソーシアムの活動内容】
本コンソーシアムの活動内容は、主に以下の3点の研究開発、社会実装を進めてまいります。
【1】 「自動同時通訳基盤技術」の研究開発
【2】 「自動同時通訳システム技術」の研究開発
【3】 「自動同時通訳システム」の社会実装
それぞれの活動は、コンソーシアム内各団体により、以下のように推進いたします。
【1】 「自動同時通訳基盤技術」の研究開発
(1) 入力分割・要約・翻訳出力最適化技術 [担当: 国立研究開発法人情報通信研究機構]
同時通訳実現に必要となる長い発話を翻訳可能な短い意味的まとまりに分割する技術、内容を要約する技術などを研究開発します。
(2) 多様な情報源を活用した通訳精度向上技術 [担当: マインドワード株式会社]
通訳精度の向上を図るため、文脈、画像等、翻訳単位を超えた様々な情報を紐付けて、AI学習により文脈理解、状況認識などを通訳に反映する技術を研究開発します。
(3) 自動通訳性能評価尺度の確立 [担当: 株式会社インターグループ]
自動同時通訳システムの性能評価のための、性能評価尺度および決定手法を研究開発します。
【2】 「自動同時通訳システム技術」の研究開発
(1) 自動同時通訳ユーザインタフェース(UI)技術
a) システム利活用要件に応じた総合検証技術 [担当: 凸版印刷株式会社]
様々な状況における自動同時通訳システムの実用シーンを念頭におき、自動同時通訳システムの最適なユーザインタフェース技術を研究開発します。実施にあたっては、通訳ニーズが高い実社会の複数の分野・場面で実証を実施し、得られた知見などを「自動同時通訳ユーザインタフェース(UI)技術」へフィードバックしながら繰り返し改善を図っていくアジャイル型の手法により研究開発を推進します。
令和2年度は、通訳ニーズが高いと思われる以下の1.~4.のシーンでの社会実証を実施します。
1. アバター対話 [担当: 凸版印刷株式会社]
新しいコミュニケーションインタフェースであるアバターを活用し、美術館・博物館において、説明員から来場者に対する説明を実施。
2. 情報伝達 [担当: 東日本電信電話株式会社]
字幕表示と通訳を組み合わせたシステムにより、自治体などから住民に対して一斉に行われる説明事項の表示や災害避難所での説明内容の伝達などを実施。
3. 対面・遠隔会話 [担当: 凸版印刷株式会社、ソースネクスト株式会社
話者・聞き手の持つ端末から通訳結果をディスプレイ表示するシステムにより、教育機関における教員と保護者の意思伝達を実施するとともに、リアル環境・オンライン環境双方での講演会・会議における意思伝達を実施。
4. 遠隔協業 [担当: 株式会社KDDIテクノロジー]
遠隔作業支援システムに通訳機能を追加し、生産現場などで作業員が装着するウェアラブルデバイスを介して、言語が異なる作業員へ遠隔地からの指示を実施。
b) 入力音源分離技術 [担当: ヤマハ株式会社]
各話者個別にマイクを割り当てて独立に音声認識を行う条件において、話者外の音声や背景雑音が混入している場合でも、適切に音声認識が可能となる技術を研究開発します。パネルディスカッションなど複数人が発話する環境、および、工場見学・展示会・観光地など背景音が混在する環境において、社会実証を通じて検証を行い、研究開発にフィードバックすることにより向上・改善を推進します。
(2) 自動同時通訳プラットフォーム技術 [担当: フェアリーデバイセズ株式会社]
自動同時通訳システムを実社会で広く利用できるようにするため、自動同時通訳に必須となるAI学習、検証・評価用のデータベースに基づく自動同時通訳プラットフォーム技術を研究開発します。
【3】 「自動同時通訳システム」の社会実装
上記【1】【2】における研究開発成果が民間企業において製品化・事業化されるなど、自動同時通訳システムの社会実装につながるように進めるため、自動同時通訳技術が根付き利活用されるモデルを検討、試行します。
【本事業に期待される効果】
本事業によって創出した自動翻訳の技術とシステムにより、国内外の多種多様なシーンでの『同時通訳』ニーズに応え、社会経済活動において「言葉の壁」を感じさせない環境を創出することにより、企業等の労働生産性の向上や「働き方改革」の推進、利用者利便の一層の増進に寄与します。
(※1) https://www.soumu.go.jp/menu_news/s-news/02tsushin03_04000393.html
(※2) https://www.soumu.go.jp/menu_news/s-news/01tsushin03_02000298.html
※本件は、総務省の「ICT重点技術の研究開発プロジェクト(JPMI00316)」における「多言語翻訳技術の高度化に関する研究開発」の委託を受けて実施する研究開発の計画に係るものです。
(注) 本研究開発では、通訳ニーズが高い実社会の複数の分野・場面での社会実証を通じて得られた知見をフィードバックしながら進めていくこととしており、グローバルコミュニケーション計画2025(2020年3月31日総務省)(※2)を参考に、有識者の意見も踏まえながら、社会実証すべき内容及び実施団体を選定したものです。
【背景】
日本社会の急速なグローバル化に伴い、ビジネスでの議論・交渉などの場面、国際イベントの場面など、リアルアイムでの意思疎通を可能とする同時通訳へのニーズが高まっています。このニーズに応えるため「自動の『同時通訳』システム」の実現が期待されています。
現在の音声翻訳技術は、発話者が一区切りの発話を完了したところで発話を停止し、一区切りの文章を通訳するものです(これを「逐次通訳」と呼びます)。これに対して、「同時通訳」は、話者の発話が終了する前から通訳者が発話の一部を訳出することを繰り返すものです。
同時通訳は、逐次通訳と比較して、発話内容が翻訳されて相手に伝わるまでの時間が短縮でき、さらに発話者が発話を中断する必要もない、という大きなメリットがあります。しかしながら、現在の音声翻訳技術は、同時通訳には対応しておらず、加えて、文脈などの補足情報も反映することができず、「人間の同時通訳」には遠く及びません。
本コンソーシアムでは、AIによる「同時通訳」技術の研究開発を行い、社会実装に向けた実証と改良を推進します。
【本コンソーシアムの活動内容】
本コンソーシアムの活動内容は、主に以下の3点の研究開発、社会実装を進めてまいります。
【1】 「自動同時通訳基盤技術」の研究開発
【2】 「自動同時通訳システム技術」の研究開発
【3】 「自動同時通訳システム」の社会実装
それぞれの活動は、コンソーシアム内各団体により、以下のように推進いたします。
【1】 「自動同時通訳基盤技術」の研究開発
(1) 入力分割・要約・翻訳出力最適化技術 [担当: 国立研究開発法人情報通信研究機構]
同時通訳実現に必要となる長い発話を翻訳可能な短い意味的まとまりに分割する技術、内容を要約する技術などを研究開発します。
(2) 多様な情報源を活用した通訳精度向上技術 [担当: マインドワード株式会社]
通訳精度の向上を図るため、文脈、画像等、翻訳単位を超えた様々な情報を紐付けて、AI学習により文脈理解、状況認識などを通訳に反映する技術を研究開発します。
(3) 自動通訳性能評価尺度の確立 [担当: 株式会社インターグループ]
自動同時通訳システムの性能評価のための、性能評価尺度および決定手法を研究開発します。
【2】 「自動同時通訳システム技術」の研究開発
(1) 自動同時通訳ユーザインタフェース(UI)技術
a) システム利活用要件に応じた総合検証技術 [担当: 凸版印刷株式会社]
様々な状況における自動同時通訳システムの実用シーンを念頭におき、自動同時通訳システムの最適なユーザインタフェース技術を研究開発します。実施にあたっては、通訳ニーズが高い実社会の複数の分野・場面で実証を実施し、得られた知見などを「自動同時通訳ユーザインタフェース(UI)技術」へフィードバックしながら繰り返し改善を図っていくアジャイル型の手法により研究開発を推進します。
令和2年度は、通訳ニーズが高いと思われる以下の1.~4.のシーンでの社会実証を実施します。
1. アバター対話 [担当: 凸版印刷株式会社]
新しいコミュニケーションインタフェースであるアバターを活用し、美術館・博物館において、説明員から来場者に対する説明を実施。
2. 情報伝達 [担当: 東日本電信電話株式会社]
字幕表示と通訳を組み合わせたシステムにより、自治体などから住民に対して一斉に行われる説明事項の表示や災害避難所での説明内容の伝達などを実施。
3. 対面・遠隔会話 [担当: 凸版印刷株式会社、ソースネクスト株式会社
話者・聞き手の持つ端末から通訳結果をディスプレイ表示するシステムにより、教育機関における教員と保護者の意思伝達を実施するとともに、リアル環境・オンライン環境双方での講演会・会議における意思伝達を実施。
4. 遠隔協業 [担当: 株式会社KDDIテクノロジー]
遠隔作業支援システムに通訳機能を追加し、生産現場などで作業員が装着するウェアラブルデバイスを介して、言語が異なる作業員へ遠隔地からの指示を実施。
b) 入力音源分離技術 [担当: ヤマハ株式会社]
各話者個別にマイクを割り当てて独立に音声認識を行う条件において、話者外の音声や背景雑音が混入している場合でも、適切に音声認識が可能となる技術を研究開発します。パネルディスカッションなど複数人が発話する環境、および、工場見学・展示会・観光地など背景音が混在する環境において、社会実証を通じて検証を行い、研究開発にフィードバックすることにより向上・改善を推進します。
(2) 自動同時通訳プラットフォーム技術 [担当: フェアリーデバイセズ株式会社]
自動同時通訳システムを実社会で広く利用できるようにするため、自動同時通訳に必須となるAI学習、検証・評価用のデータベースに基づく自動同時通訳プラットフォーム技術を研究開発します。
【3】 「自動同時通訳システム」の社会実装
上記【1】【2】における研究開発成果が民間企業において製品化・事業化されるなど、自動同時通訳システムの社会実装につながるように進めるため、自動同時通訳技術が根付き利活用されるモデルを検討、試行します。
【本事業に期待される効果】
本事業によって創出した自動翻訳の技術とシステムにより、国内外の多種多様なシーンでの『同時通訳』ニーズに応え、社会経済活動において「言葉の壁」を感じさせない環境を創出することにより、企業等の労働生産性の向上や「働き方改革」の推進、利用者利便の一層の増進に寄与します。
(※1) https://www.soumu.go.jp/menu_news/s-news/02tsushin03_04000393.html
(※2) https://www.soumu.go.jp/menu_news/s-news/01tsushin03_02000298.html
※本件は、総務省の「ICT重点技術の研究開発プロジェクト(JPMI00316)」における「多言語翻訳技術の高度化に関する研究開発」の委託を受けて実施する研究開発の計画に係るものです。