製薬業界向けAI翻訳の精度を向上させる「製薬カスタムモデル共同開発」の第二期メンバー募集を開始
[19/12/19]
提供元:@Press
提供元:@Press
NTTコミュニケーションズ株式会社(本社:東京都千代田区、代表取締役社長:庄司 哲也、以下 NTT Com)、株式会社みらい翻訳(本社:東京都渋谷区、代表取締役社長:栄藤 稔、以下 みらい翻訳)、および株式会社翻訳センター(本社:大阪府大阪市、代表取締役社長:二宮 俊一郎、以下 翻訳センター)は、3社が主催する「製薬カスタムモデル共同開発」(以下 本取り組み)において、2019年12月19日より、新たな製薬企業メンバーの公募を開始します。
本取り組みの参加メンバーは、NTT ComのAI翻訳プラットフォームサービス「COTOHA(R) Translator」上で、製薬関連文書の翻訳に特化した高精度の自動翻訳を利用することができるようになります。
今回の公募に先立ち、第一期メンバー(12社)からコーパスの提供を受けて行ったクローズドテストにおいて、既に翻訳精度の大幅な向上効果が確認できました。
第二期メンバーの募集は、この成果を踏まえ、さらに取り組みの拡大を目指すものです。
1. 背景
製薬業界では、治験薬概要書や治験実施計画書などの膨大な文書を翻訳する必要があり、その稼働の軽減が課題となっています。これらの文書は、難解な専門用語や複雑な文章を含むため、AIによる自動翻訳が利用できるようになった昨今でも、実用的な精度での翻訳は容易ではありません。
本取り組みによって、製薬業界向けAI翻訳の精度向上を通じた業界全体におけるデジタルトランスフォーメーション(DX)を促進します。
2.本取り組みの概要
AI翻訳の精度を高めるためには、機械学習用に収集するコーパス(※1)の数を増やしていくことが重要です。一社で収集できるコーパスの数は限られていても、参加企業間でコーパスを持ち寄ることで、大きな精度向上が期待できることから、企業メンバーの募集を行います。第一期で収集したコーパスに、第二期で収集するコーパスを追加拡充することにより、さらなる精度向上を図ります。
なお、各社のコーパスについては、機密が保たれるように運用し、本取り組みに参加いただいたメンバーの間でのみ利用します。
3. 募集期間
2019年12月19日から
4. 対応言語
日本語から英語、および英語から日本語への翻訳
5. 主催各社の役割
NTT Com:COTOHA(R) Translator 製薬カスタムモデル サービス提供、
参加希望各社に対するフォローアップ
みらい翻訳:機械翻訳エンジン(※2)を含むアプリケーション開発、
製薬カスタムモデル開発
翻訳センター:翻訳プロフェッショナルサービスの提供、
コーパスアライメント業務および翻訳品質評価
(参考) COTOHA(R) Translator
最新のニューラルマシントランスレーション技術と、NTTグループの強みである日本語解析技術、および株式会社みらい翻訳と国立研究開発法人 情報通信研究機構との共同開発による翻訳エンジンを活用することで、高精度な自動翻訳を可能にしたサービスです。英語翻訳においては、TOEIC 960点を超える精度(※3)をマークしており、中国語翻訳においても高い精度を実現しているほか、多言語の翻訳に対応するオプションも提供しています。
また、PowerPointなどMicrosoft Office形式のファイルやPDFファイルをドラッグ&ドロップするだけで、元のレイアウトのまま短時間で翻訳することが可能です。
※1: 自然言語の文章を体系的に収集した大規模なデータベースのこと。とくに自然言語処理においては、構造化され、付加的な情報とともに集積されたものを指します。
※2: みらい翻訳の機械翻訳エンジンの一部は、国立研究開発法人情報通信研究機構(NICT)の研究成果を利用して、みらい翻訳にて製品化したものです。
※3: 日本語、英語それぞれのサンプル文章に対して、NMTを用いた本サービスと人力翻訳(TOEIC 900点以上のビジネスマン数人、辞書使用可)による翻訳を実施。複数の第三者の翻訳専門家が「情報伝達度」と「滑らかさ」の2つの観点で5段階評価を行い、その平均スコアを算出して比較したところ、本サービスが960点以上のビジネスマンの平均値と同等になりました。(2019年12月時点、精度は随時向上中)
*文中に記載の社名、商品名およびロゴは各社の商標または登録商標です。
本取り組みの参加メンバーは、NTT ComのAI翻訳プラットフォームサービス「COTOHA(R) Translator」上で、製薬関連文書の翻訳に特化した高精度の自動翻訳を利用することができるようになります。
今回の公募に先立ち、第一期メンバー(12社)からコーパスの提供を受けて行ったクローズドテストにおいて、既に翻訳精度の大幅な向上効果が確認できました。
第二期メンバーの募集は、この成果を踏まえ、さらに取り組みの拡大を目指すものです。
1. 背景
製薬業界では、治験薬概要書や治験実施計画書などの膨大な文書を翻訳する必要があり、その稼働の軽減が課題となっています。これらの文書は、難解な専門用語や複雑な文章を含むため、AIによる自動翻訳が利用できるようになった昨今でも、実用的な精度での翻訳は容易ではありません。
本取り組みによって、製薬業界向けAI翻訳の精度向上を通じた業界全体におけるデジタルトランスフォーメーション(DX)を促進します。
2.本取り組みの概要
AI翻訳の精度を高めるためには、機械学習用に収集するコーパス(※1)の数を増やしていくことが重要です。一社で収集できるコーパスの数は限られていても、参加企業間でコーパスを持ち寄ることで、大きな精度向上が期待できることから、企業メンバーの募集を行います。第一期で収集したコーパスに、第二期で収集するコーパスを追加拡充することにより、さらなる精度向上を図ります。
なお、各社のコーパスについては、機密が保たれるように運用し、本取り組みに参加いただいたメンバーの間でのみ利用します。
3. 募集期間
2019年12月19日から
4. 対応言語
日本語から英語、および英語から日本語への翻訳
5. 主催各社の役割
NTT Com:COTOHA(R) Translator 製薬カスタムモデル サービス提供、
参加希望各社に対するフォローアップ
みらい翻訳:機械翻訳エンジン(※2)を含むアプリケーション開発、
製薬カスタムモデル開発
翻訳センター:翻訳プロフェッショナルサービスの提供、
コーパスアライメント業務および翻訳品質評価
(参考) COTOHA(R) Translator
最新のニューラルマシントランスレーション技術と、NTTグループの強みである日本語解析技術、および株式会社みらい翻訳と国立研究開発法人 情報通信研究機構との共同開発による翻訳エンジンを活用することで、高精度な自動翻訳を可能にしたサービスです。英語翻訳においては、TOEIC 960点を超える精度(※3)をマークしており、中国語翻訳においても高い精度を実現しているほか、多言語の翻訳に対応するオプションも提供しています。
また、PowerPointなどMicrosoft Office形式のファイルやPDFファイルをドラッグ&ドロップするだけで、元のレイアウトのまま短時間で翻訳することが可能です。
※1: 自然言語の文章を体系的に収集した大規模なデータベースのこと。とくに自然言語処理においては、構造化され、付加的な情報とともに集積されたものを指します。
※2: みらい翻訳の機械翻訳エンジンの一部は、国立研究開発法人情報通信研究機構(NICT)の研究成果を利用して、みらい翻訳にて製品化したものです。
※3: 日本語、英語それぞれのサンプル文章に対して、NMTを用いた本サービスと人力翻訳(TOEIC 900点以上のビジネスマン数人、辞書使用可)による翻訳を実施。複数の第三者の翻訳専門家が「情報伝達度」と「滑らかさ」の2つの観点で5段階評価を行い、その平均スコアを算出して比較したところ、本サービスが960点以上のビジネスマンの平均値と同等になりました。(2019年12月時点、精度は随時向上中)
*文中に記載の社名、商品名およびロゴは各社の商標または登録商標です。