FastLabel、LLM開発用の日本語データセット作成代行サービスを開始
[23/11/29]
提供元:PRTIMES
提供元:PRTIMES
AI開発に必要なデータ収集・生成からアノテーション、モデル開発、MLOps構築までの全工程をサポートしているFastLabel株式会社(本社:東京都品川区、代表取締役CEO:上田英介、以下「FastLabel」)は、大規模言語モデル(以下、LLM)開発用の日本語データセット作成代行サービスを2023年11月29日より開始したことをお知らせいたします。
[画像: https://prtimes.jp/i/65427/127/resize/d65427-127-df6d948f8971ce731b50-0.png ]
LLM開発用日本語データセット作成代行サービス開始の背景
当社は、2020年1月の創業以来、教師データ作成代行やアノテーションツールの提供を主力事業として展開。現在ではデータセントリックなAI開発プロセス全体を包括的に支援するサービス(業務代行及びコンサルティング)およびシステム(各種ツール)を提供しています。
米OpenAI社の「GPT-4」、米Meta社の「Llama2」、米Google社の「PaLM2」を始めとするLLMが公開されたことを受け、コンテンツを生成することが可能な生成AI(Generative AI)技術が急速に発展しています。それらの流れを受け、NTT社、サイバーエージェント社、rinna社など国内でも多くの企業が日本語のLLM開発を開始しております。
しかしながら、日本語のLLM開発においては、AIに学習させるために日本語で作成されたデータセットが少なく、さらにそれらのデータセットには潜在的な著作権侵害や利用規約違反のリスクが伴う状況です。
上述を背景として、自社でLLM開発用の日本語データセットを作成する動きも見られますが、自社でのデータセット作成には多くのコストが発生するため、開発に必要となる多量のデータを準備することは容易ではありません。そこで、最大限権利をクリアし、安全かつ、LLM開発の高速化も実現できる短納期でのデータセット提供を可能とするため、当社はLLM開発用データセットの作成代行サービスの開始に至りました。
当社が提供するLLM開発用データセット作成代行サービスの特徴
当社が提供するLLM開発用データセット作成代行サービスの特徴は以下の3点です。
・権利クリアされた安心なデータセットであること
当社の作成代行サービスでは、LLMに特化したプロフェッショナル人材を登用しており、Q&Aなどのデータをゼロから作成することで権利リスクがないデータセットの提供が可能です。
・自社の開発ニーズに合わせて柔軟にカスタマイズしたデータセットの提供が可能であること
当社のAI開発をデータの側面から幅広くご支援してきた実績とAI開発への深い知見を活かし、ビジネス、金融といったジャンル別でのデータセット作成など柔軟にカスタマイズしたデータセットの提供が可能です。
・低コストでのデータセット提供が可能であること
当社で開発しているLLMを活用してデータセット作成を自動化することで、コストを抑えて大量のデータセットの提供が可能です。
LLM開発用データセット作成代行サービスのお問い合せ
お問い合せまたはお見積りを希望のお客様は、以下のメールアドレスまたはURLからお問合せください。
お問い合わせ・お見積り用メールアドレス:info@fastlabel.ai
URL:https://fastlabel.ai/dataset/llm
当社のデータセット事業について
当社は、データセットの作成代行、販売および、以下に対応したデータ収集代行サービスを展開しております。
・画像(人物撮り下ろし、帳票データ収集 他)
・動画(スポーツ動画撮影、走行車両撮影 他)
・音声(スクリプト発話、ノイズ収音 他)
・テキスト(会話コーパス 他)* LLM開発用途含む
【データ収集代行サービスの取り組み事例】
・ソニーネットワークコミュニケーションズ株式会社:https://fastlabel.ai/casestudy/snc
・AWL株式会社:https://fastlabel.ai/casestudy/awl
■今後の展望
当社は、権利クリアなデータを幅広い業種・業界のAI開発現場へスピーディーに提供するため、さらなるデータセットの拡充を進めてまいります。また、システムと業務の両面からAI開発プロセスを効率化し、AI開発に取り組む企業、研究機関のインフラとなることで、日本社会におけるAI革命を下支えしていきたいと考えております。
FastLabel株式会社について
社名:FastLabel株式会社
代表者:代表取締役CEO 上田 英介
事業内容:AI開発を包括的に支援する「AIPaaS」(※)の提供(AIデータプラットフォーム、アノテーションサービス)
設立:2020年1月23日
本社所在地:〒141-0001 東京都品川区北品川5-5-27 201号
URL:https://fastlabel.ai/
※)AIPaaS…AI Process as a Service、AI開発プロセスを高速化・高度化させるサービス、プロダクトの総称
本プレスリリースに関するお問い合わせ
FastLabel株式会社
広報担当 pr@fastlabel.ai
[画像: https://prtimes.jp/i/65427/127/resize/d65427-127-df6d948f8971ce731b50-0.png ]
LLM開発用日本語データセット作成代行サービス開始の背景
当社は、2020年1月の創業以来、教師データ作成代行やアノテーションツールの提供を主力事業として展開。現在ではデータセントリックなAI開発プロセス全体を包括的に支援するサービス(業務代行及びコンサルティング)およびシステム(各種ツール)を提供しています。
米OpenAI社の「GPT-4」、米Meta社の「Llama2」、米Google社の「PaLM2」を始めとするLLMが公開されたことを受け、コンテンツを生成することが可能な生成AI(Generative AI)技術が急速に発展しています。それらの流れを受け、NTT社、サイバーエージェント社、rinna社など国内でも多くの企業が日本語のLLM開発を開始しております。
しかしながら、日本語のLLM開発においては、AIに学習させるために日本語で作成されたデータセットが少なく、さらにそれらのデータセットには潜在的な著作権侵害や利用規約違反のリスクが伴う状況です。
上述を背景として、自社でLLM開発用の日本語データセットを作成する動きも見られますが、自社でのデータセット作成には多くのコストが発生するため、開発に必要となる多量のデータを準備することは容易ではありません。そこで、最大限権利をクリアし、安全かつ、LLM開発の高速化も実現できる短納期でのデータセット提供を可能とするため、当社はLLM開発用データセットの作成代行サービスの開始に至りました。
当社が提供するLLM開発用データセット作成代行サービスの特徴
当社が提供するLLM開発用データセット作成代行サービスの特徴は以下の3点です。
・権利クリアされた安心なデータセットであること
当社の作成代行サービスでは、LLMに特化したプロフェッショナル人材を登用しており、Q&Aなどのデータをゼロから作成することで権利リスクがないデータセットの提供が可能です。
・自社の開発ニーズに合わせて柔軟にカスタマイズしたデータセットの提供が可能であること
当社のAI開発をデータの側面から幅広くご支援してきた実績とAI開発への深い知見を活かし、ビジネス、金融といったジャンル別でのデータセット作成など柔軟にカスタマイズしたデータセットの提供が可能です。
・低コストでのデータセット提供が可能であること
当社で開発しているLLMを活用してデータセット作成を自動化することで、コストを抑えて大量のデータセットの提供が可能です。
LLM開発用データセット作成代行サービスのお問い合せ
お問い合せまたはお見積りを希望のお客様は、以下のメールアドレスまたはURLからお問合せください。
お問い合わせ・お見積り用メールアドレス:info@fastlabel.ai
URL:https://fastlabel.ai/dataset/llm
当社のデータセット事業について
当社は、データセットの作成代行、販売および、以下に対応したデータ収集代行サービスを展開しております。
・画像(人物撮り下ろし、帳票データ収集 他)
・動画(スポーツ動画撮影、走行車両撮影 他)
・音声(スクリプト発話、ノイズ収音 他)
・テキスト(会話コーパス 他)* LLM開発用途含む
【データ収集代行サービスの取り組み事例】
・ソニーネットワークコミュニケーションズ株式会社:https://fastlabel.ai/casestudy/snc
・AWL株式会社:https://fastlabel.ai/casestudy/awl
■今後の展望
当社は、権利クリアなデータを幅広い業種・業界のAI開発現場へスピーディーに提供するため、さらなるデータセットの拡充を進めてまいります。また、システムと業務の両面からAI開発プロセスを効率化し、AI開発に取り組む企業、研究機関のインフラとなることで、日本社会におけるAI革命を下支えしていきたいと考えております。
FastLabel株式会社について
社名:FastLabel株式会社
代表者:代表取締役CEO 上田 英介
事業内容:AI開発を包括的に支援する「AIPaaS」(※)の提供(AIデータプラットフォーム、アノテーションサービス)
設立:2020年1月23日
本社所在地:〒141-0001 東京都品川区北品川5-5-27 201号
URL:https://fastlabel.ai/
※)AIPaaS…AI Process as a Service、AI開発プロセスを高速化・高度化させるサービス、プロダクトの総称
本プレスリリースに関するお問い合わせ
FastLabel株式会社
広報担当 pr@fastlabel.ai