Gcore、 AI-powered ASR(Automated Speech Recognition 自動音声認識)サービスをリリース
[24/03/25]
提供元:DreamNews
提供元:DreamNews
【画像 https://www.dreamnews.jp/?action_Image=1&p=0000296004&id=bodyimage1】
スピード、スケーラビリティ、コスト効率の基準を刷新する
放送事業サービス、動画(VOD)・コンテンツ配信サービスの新基軸
本リリースは2024年3月19日に本社 G-Core Labs S.A により発表されたリリースの抄訳です。
※一部(抄訳ではない)日本向けの情報も加えております。
ルクセンブルク:2024年3月19日 ー クラウドおよびエッジソリューションのグローバルプロバイダである Gcore は、AI ASR サービスをリリースしました。
このサービスは、Gcore ワークフローにシームレス統合されており、コンテンツやストリーミングが抱える言語に伴う障壁を下げ、サービスへのユーザアクセシビリティを高めます。そして、放送、動画配信(VOD)、ライブストリーミング、エンタープライズコンテンツ配信サービス業界において、グローバル規模で新規視聴者の獲得推進につながるサービスです。
このASR サービスは、言語処理に要する時間、スピード、コスト、ワークロード上の高負荷は従来からの課題でした。特にニュース、スポーツイベント、IR情報のライブ配信では、スピードは必須条件とされており、字幕生成を複数言語で行うのに要する長い時間と日数、さらに、字幕の精度の面でも解決策が望まれてきました。
そこで、今回リリースするAI ASR サービスでは、下記の特長・機能を有しました。
(1)ワンストップで使える ASR サービス
ASR モデルのリリースやアップデートから精査選抜されたオプションを組み込んだマネージドクラウドサービスで、対応する言語は100超、AI モデルの選定やファインチューイングをすることなく字幕生成を開始できます。モデル選定やファインチューイングが必要なユーザには、Gcore マネージドサービスチームが支援を提供します。
(2)スピードとコスト効率に優れた字幕生成
1時間程度の動画なら10分以下で字幕生成が可能です。ワードエラー率は4〜5%の範囲にとどまり、人による作業よりも高い精度を誇ります。コンテンツによっては、特定言語や特定テーマドメイン用オープンソース ASR モデルを使用することで精度強化を図ることも選択肢の一つとなります。例えば、業界専門用語や複数言語が使われているケースでは、オープンソース活用を加えるというプロセスカスタマイズを施し、精度をより高めることも可能です。
ストリーミング・プラットフォーム責任者コメント
コンテンツがグローバル化している今、視聴者へのリーチ手段として字幕はその重要度を増しています。Gcore AI ASR を有効に活用することで、コスト効率と精度の観点で放送や配信サービス刷新を、そして、なによりも、世界各地の視聴者に新しさとアクセシビリティを備えたコンテンツ配信が達成できます。これこそまさにソリューションとエッジインフラストラクチャ進化を推進するという Gcore が掲げるコミットメントです。(Alexey Petrovskikh, Head of Streaming Platform at Gcore)
Gcore AI ASR 詳細
https://gcore.com/news/ai-asr-service
※日本向けに以下追記、HQ版には記載なし
(1)リリース配信時点で Gcore AI ASR でサポートされている機能は以下になります。
・音声からの文字起こし
・字幕翻訳・生成
(2)リリース配信時点で Gcore AI ASR で日本語環境でサポートされている機能は以下になります。
・日本語音声から日本語字幕生成
・日本語音声から英語字幕生成
・英語音声から日本語字幕生成
Gcore について 〜 Gcore は2024年2月に10周年を迎えました(参考英文記事;Blog, Linkedin Post)。
Gcore はエッジ AI、クラウド、ネットワーク、セキュリティのグローバルソリューションプロバイダです。本社はルクセンブルク、600超の従業員と世界各地に10の営業拠点を擁しています。Gcore の IT インフラストラクチャは自社運用、拠点は6大陸にまたがり、グローバル平均レスポンスタイムは30ms、ヨーロッパ、アフリカ、LATAM における屈指のネットワークパフォーマンスを実現しています。ネットワークはTier IVとTier IIIのデータセンタに配備された世界各地の160超のPoPで構成され、110超Tbpsの帯域を誇ります。
Web サイト www.gcore.com
配信元企業:Gcore Japan株式会社
プレスリリース詳細へ
ドリームニューストップへ
スピード、スケーラビリティ、コスト効率の基準を刷新する
放送事業サービス、動画(VOD)・コンテンツ配信サービスの新基軸
本リリースは2024年3月19日に本社 G-Core Labs S.A により発表されたリリースの抄訳です。
※一部(抄訳ではない)日本向けの情報も加えております。
ルクセンブルク:2024年3月19日 ー クラウドおよびエッジソリューションのグローバルプロバイダである Gcore は、AI ASR サービスをリリースしました。
このサービスは、Gcore ワークフローにシームレス統合されており、コンテンツやストリーミングが抱える言語に伴う障壁を下げ、サービスへのユーザアクセシビリティを高めます。そして、放送、動画配信(VOD)、ライブストリーミング、エンタープライズコンテンツ配信サービス業界において、グローバル規模で新規視聴者の獲得推進につながるサービスです。
このASR サービスは、言語処理に要する時間、スピード、コスト、ワークロード上の高負荷は従来からの課題でした。特にニュース、スポーツイベント、IR情報のライブ配信では、スピードは必須条件とされており、字幕生成を複数言語で行うのに要する長い時間と日数、さらに、字幕の精度の面でも解決策が望まれてきました。
そこで、今回リリースするAI ASR サービスでは、下記の特長・機能を有しました。
(1)ワンストップで使える ASR サービス
ASR モデルのリリースやアップデートから精査選抜されたオプションを組み込んだマネージドクラウドサービスで、対応する言語は100超、AI モデルの選定やファインチューイングをすることなく字幕生成を開始できます。モデル選定やファインチューイングが必要なユーザには、Gcore マネージドサービスチームが支援を提供します。
(2)スピードとコスト効率に優れた字幕生成
1時間程度の動画なら10分以下で字幕生成が可能です。ワードエラー率は4〜5%の範囲にとどまり、人による作業よりも高い精度を誇ります。コンテンツによっては、特定言語や特定テーマドメイン用オープンソース ASR モデルを使用することで精度強化を図ることも選択肢の一つとなります。例えば、業界専門用語や複数言語が使われているケースでは、オープンソース活用を加えるというプロセスカスタマイズを施し、精度をより高めることも可能です。
ストリーミング・プラットフォーム責任者コメント
コンテンツがグローバル化している今、視聴者へのリーチ手段として字幕はその重要度を増しています。Gcore AI ASR を有効に活用することで、コスト効率と精度の観点で放送や配信サービス刷新を、そして、なによりも、世界各地の視聴者に新しさとアクセシビリティを備えたコンテンツ配信が達成できます。これこそまさにソリューションとエッジインフラストラクチャ進化を推進するという Gcore が掲げるコミットメントです。(Alexey Petrovskikh, Head of Streaming Platform at Gcore)
Gcore AI ASR 詳細
https://gcore.com/news/ai-asr-service
※日本向けに以下追記、HQ版には記載なし
(1)リリース配信時点で Gcore AI ASR でサポートされている機能は以下になります。
・音声からの文字起こし
・字幕翻訳・生成
(2)リリース配信時点で Gcore AI ASR で日本語環境でサポートされている機能は以下になります。
・日本語音声から日本語字幕生成
・日本語音声から英語字幕生成
・英語音声から日本語字幕生成
Gcore について 〜 Gcore は2024年2月に10周年を迎えました(参考英文記事;Blog, Linkedin Post)。
Gcore はエッジ AI、クラウド、ネットワーク、セキュリティのグローバルソリューションプロバイダです。本社はルクセンブルク、600超の従業員と世界各地に10の営業拠点を擁しています。Gcore の IT インフラストラクチャは自社運用、拠点は6大陸にまたがり、グローバル平均レスポンスタイムは30ms、ヨーロッパ、アフリカ、LATAM における屈指のネットワークパフォーマンスを実現しています。ネットワークはTier IVとTier IIIのデータセンタに配備された世界各地の160超のPoPで構成され、110超Tbpsの帯域を誇ります。
Web サイト www.gcore.com
配信元企業:Gcore Japan株式会社
プレスリリース詳細へ
ドリームニューストップへ