自動車法規文の自動翻訳をニューラル技術で高精度化 〜トヨタとの共同研究で英日・中日翻訳の実用度向上〜
[19/04/23]
提供元:共同通信PRワイヤー
提供元:共同通信PRワイヤー
2019年4月23日
国立研究開発法人情報通信研究機構(NICT)
自動車法規文の自動翻訳をニューラル技術で高精度化
〜トヨタとの共同研究を通じ、英日・中日翻訳の実用度が向上〜
【ポイント】
■ 自動車業界からトヨタが翻訳バンクに協力、翻訳データを提供
■ 自動車法規を対象とした翻訳をニューラル英日翻訳システムで24%実用度向上
■ 数万点に及ぶ部品のメーカーを含めた裾野の広い自動車業界全体への波及効果は絶大
国立研究開発法人情報通信研究機構(NICT、理事長: 徳田 英幸)は、トヨタ自動車株式会社(トヨタ、代表取締役社長: 豊田 章男)と、自動車法規を対象としたニューラル英日・中日自動翻訳の共同研究を実施し、実用度向上を確認しました。これにより、自動車業界全体でのニューラル自動翻訳の活用が大きく期待できます。
今後は、本技術を法規文以外のマニュアル等の多種多様な文献に展開するとともに、多言語化を進め、自動車産業で必要となるあらゆる翻訳を高効率化することを目指します。
【背景】
自動車及び自動車部品の設計・製造・輸出に当たっては、安全確保・環境保護等の様々な観点から、各国が定める法規の要件を満足することが求められています。そのためには、頻繁に改訂される各国の法規情報を迅速かつ正確に理解する必要があり、現状は、人による翻訳のため、精度確保には時間が掛かっています。情報の高速・高精度な翻訳は、トヨタをはじめとする自動車業界の業務効率化の鍵となっています。
NICTでは、2017年から総務省と連携して、ニューラル翻訳*1技術に不可欠な翻訳データを集積する翻訳バンク*2を運営し、製薬会社をはじめとして多数の組織からデータの提供を受けて、翻訳データの集積・活用を進めてきました。また、トヨタとは2018年6月から「自動車法規文章の自動翻訳エンジンの研究開発」で共同研究を進めてきました。
【今回の成果】
NICTは、トヨタが提供した自動車法規に関する英日・中日翻訳データを基に、汎用英日・中日ニューラルネットワーク翻訳エンジンのアダプテーション*3を行い、実用度を向上させました。
トヨタが自動車法規についてアダプテーション後の実用度を評価したところ、英日翻訳について、アダプテーション前と比べ、自動翻訳エンジンの約24%、中日翻訳については、約11%の実用度向上が得られました。これを受けて、トヨタでは、実用度向上の検討を継続することとなりました。
各国語の法規の翻訳は、自動車にとどまるものでなく輸出される全ての生産物に対して存在し、その翻訳の高速化・高精度化は同様に不可欠となり、翻訳バンクによって実現されていくことが期待されます。
【今後の展望】
今回は、英日・中日翻訳の片方向のみでしたが、今後は、?双方向に、更には、多言語にすること、?オーナーズマニュアル等の多種多様な文献に展開すること、?自動車産業全体に広げること、?広域にわたる輸出産業に広げることを目指します。
<用語解説>
*1 ニューラル翻訳(NMT)
脳の神経回路を模したニューラルネットワークを用いた自動翻訳技術。膨大な翻訳データを用いてトレーニングしたニューラルネットワークで翻訳することで、従来の翻訳技術よりも高い翻訳精度が確認されている。
https://www.nict.go.jp/press/2017/06/28-1.html (NICT)
*2 翻訳バンク
ニューラル技術による自動翻訳の精度向上には、アルゴリズムの改良に加えて、翻訳データの質と量の影響も大きく、高品質翻訳データの大量の確保が重要となる。NICTは、総務省と共に翻訳データを集積する「翻訳バンク」を運用し、日本語の翻訳技術の多分野化・高精度化に取り組んでいる。
http://h-bank.nict.go.jp/index.html
https://www.nict.go.jp/press/2017/09/08-1.html(NICT)
提供された翻訳データは、既存の翻訳データと併せて、ニューラルネットのトレーニングに活用され、技術移転される。最新版の翻訳精度は、NICTの開発した音声翻訳アプリVoiceTra*4や文字ベースの自動翻訳システムTexTra*5で自由に確認できる。
*3 アダプテーション
翻訳バンクで追加した翻訳データを用いて、精度を改善するようにトレーニング済みのNMTのニューラルネットワークを更に調整すること。
*4 VoiceTra
言葉の壁で困らない社会実現を目指してNICTが開発した多言語音声翻訳アプリ。NMTを用いて、観光地での旅行会話はもとより、病院、商業施設といった様々なシーンで精度の高い音声翻訳を提供している。世界31の言語に対応。
https://voicetra.nict.go.jp/
*5 TexTra
NICTでは、文字入力用のNMTをTexTraと名付けて公開している。公開サイト「みんなの自動翻訳@TexTra」では、コピー・ペーストしたり、サイト上の翻訳エディタを利用したり、ワードやパワーポイントのファイルを直接翻訳したり、API(Application Programming Interface)を介してプログラムから利用するなど、様々な方法で翻訳精度を試すことができる。
https://mt-auto-minhon-mlt.ucri.jgn-x.jp/(NICT)
国立研究開発法人情報通信研究機構(NICT)
自動車法規文の自動翻訳をニューラル技術で高精度化
〜トヨタとの共同研究を通じ、英日・中日翻訳の実用度が向上〜
【ポイント】
■ 自動車業界からトヨタが翻訳バンクに協力、翻訳データを提供
■ 自動車法規を対象とした翻訳をニューラル英日翻訳システムで24%実用度向上
■ 数万点に及ぶ部品のメーカーを含めた裾野の広い自動車業界全体への波及効果は絶大
国立研究開発法人情報通信研究機構(NICT、理事長: 徳田 英幸)は、トヨタ自動車株式会社(トヨタ、代表取締役社長: 豊田 章男)と、自動車法規を対象としたニューラル英日・中日自動翻訳の共同研究を実施し、実用度向上を確認しました。これにより、自動車業界全体でのニューラル自動翻訳の活用が大きく期待できます。
今後は、本技術を法規文以外のマニュアル等の多種多様な文献に展開するとともに、多言語化を進め、自動車産業で必要となるあらゆる翻訳を高効率化することを目指します。
【背景】
自動車及び自動車部品の設計・製造・輸出に当たっては、安全確保・環境保護等の様々な観点から、各国が定める法規の要件を満足することが求められています。そのためには、頻繁に改訂される各国の法規情報を迅速かつ正確に理解する必要があり、現状は、人による翻訳のため、精度確保には時間が掛かっています。情報の高速・高精度な翻訳は、トヨタをはじめとする自動車業界の業務効率化の鍵となっています。
NICTでは、2017年から総務省と連携して、ニューラル翻訳*1技術に不可欠な翻訳データを集積する翻訳バンク*2を運営し、製薬会社をはじめとして多数の組織からデータの提供を受けて、翻訳データの集積・活用を進めてきました。また、トヨタとは2018年6月から「自動車法規文章の自動翻訳エンジンの研究開発」で共同研究を進めてきました。
【今回の成果】
NICTは、トヨタが提供した自動車法規に関する英日・中日翻訳データを基に、汎用英日・中日ニューラルネットワーク翻訳エンジンのアダプテーション*3を行い、実用度を向上させました。
トヨタが自動車法規についてアダプテーション後の実用度を評価したところ、英日翻訳について、アダプテーション前と比べ、自動翻訳エンジンの約24%、中日翻訳については、約11%の実用度向上が得られました。これを受けて、トヨタでは、実用度向上の検討を継続することとなりました。
各国語の法規の翻訳は、自動車にとどまるものでなく輸出される全ての生産物に対して存在し、その翻訳の高速化・高精度化は同様に不可欠となり、翻訳バンクによって実現されていくことが期待されます。
【今後の展望】
今回は、英日・中日翻訳の片方向のみでしたが、今後は、?双方向に、更には、多言語にすること、?オーナーズマニュアル等の多種多様な文献に展開すること、?自動車産業全体に広げること、?広域にわたる輸出産業に広げることを目指します。
<用語解説>
*1 ニューラル翻訳(NMT)
脳の神経回路を模したニューラルネットワークを用いた自動翻訳技術。膨大な翻訳データを用いてトレーニングしたニューラルネットワークで翻訳することで、従来の翻訳技術よりも高い翻訳精度が確認されている。
https://www.nict.go.jp/press/2017/06/28-1.html (NICT)
*2 翻訳バンク
ニューラル技術による自動翻訳の精度向上には、アルゴリズムの改良に加えて、翻訳データの質と量の影響も大きく、高品質翻訳データの大量の確保が重要となる。NICTは、総務省と共に翻訳データを集積する「翻訳バンク」を運用し、日本語の翻訳技術の多分野化・高精度化に取り組んでいる。
http://h-bank.nict.go.jp/index.html
https://www.nict.go.jp/press/2017/09/08-1.html(NICT)
提供された翻訳データは、既存の翻訳データと併せて、ニューラルネットのトレーニングに活用され、技術移転される。最新版の翻訳精度は、NICTの開発した音声翻訳アプリVoiceTra*4や文字ベースの自動翻訳システムTexTra*5で自由に確認できる。
*3 アダプテーション
翻訳バンクで追加した翻訳データを用いて、精度を改善するようにトレーニング済みのNMTのニューラルネットワークを更に調整すること。
*4 VoiceTra
言葉の壁で困らない社会実現を目指してNICTが開発した多言語音声翻訳アプリ。NMTを用いて、観光地での旅行会話はもとより、病院、商業施設といった様々なシーンで精度の高い音声翻訳を提供している。世界31の言語に対応。
https://voicetra.nict.go.jp/
*5 TexTra
NICTでは、文字入力用のNMTをTexTraと名付けて公開している。公開サイト「みんなの自動翻訳@TexTra」では、コピー・ペーストしたり、サイト上の翻訳エディタを利用したり、ワードやパワーポイントのファイルを直接翻訳したり、API(Application Programming Interface)を介してプログラムから利用するなど、様々な方法で翻訳精度を試すことができる。
https://mt-auto-minhon-mlt.ucri.jgn-x.jp/(NICT)