株式会社フォアー、意味論的ユーザーリコメンドシステム「Twitterコトダマサーチ」の運営を開始
[22/11/17]
提供元:PRTIMES
提供元:PRTIMES
Twitterコトダマサーチは、各ユーザーのテキストを単語埋め込みによりベクトル化し、ベクトル間の距離に基づきユーザー間の類似性を評価する手法を用いています。つまり、ユーザーが発信・公開したツイートテキストの情報のみに基づいて近しいユーザーをリコメンドすることができるため、主にユーザーの行動履歴に基づいてリコメンドを行う既存手法ではリーチできない相手を見つけたり、Twitter 上の潜在顧客を見つけ出したりすることができます。
[画像: https://prtimes.jp/i/32885/25/resize/d32885-25-f50e4f886915025d71f4-0.png ]
【背景】
近年、自然言語処理に基づくリコメンドアルゴリズムは、マーケティングツールやソーシャルネットワークをはじめとする様々な領域のサービスで活用されるようになりました。
現在、主流とされているリコメンドアルゴリズムには、個人の属性情報やテキスト情報を参照し、それらの内容が近いユーザーや商品をリコメンドする「コンテンツベースフィルタリング」や、ユーザーの嗜好と不特定多数のユーザーの嗜好記録の比較をもとにアセスメントをおこなう「協調フィルタリング」などがあり、一定の効果が認められています。
しかし、「コンテンツベースフィルタリング」「協調フィルタリング」のような手法は、活動履歴の少ないユーザーを正確に抽出できないという「コールドスタート問題」や小規模なサービスにおいて十分なユーザー情報が得られず、有効なアセスメントがしにくいという課題を抱えていました。
これらの課題に対し、長岡科学技術大学知能情報学研究室の白川智弘准教授らのチームは、文章をベクトルに変換する単語埋め込みの手法[TS1] を使用し、それにより生成されたベクトル間の距離により判定されるテキスト間の類似性からリコメンドを行う方法(※1)[TS2] を提案しており、ユーザー同士のつながりの多寡、活動履歴、サービスの規模などに依存しない形でのリコメンドシステムの研究に取り組んできました。
このリコメンドシステムの効果を測定するための実証実験(※1)では、既存リコメンド手法に比べて高いエンゲージメント率の獲得が認められたため、今回、「Twitterコトダマサーチ」としてWEBシステム化して一般公開することとなりました。
【Twitterコトダマサーチの概要】
1.データベース
株式会社 Fore- により収集された、日本人ユーザー約 2600 万人分のリスト並びにこれらのユーザーによるツイートテキストから構成されています。
2.ベクトル間距離に基づくリコメンド
Twitterコトダマサーチでは、Twitterのスクリーンネーム(@XXX)を入力すると、データベースが参照され、対象ユーザーのベクトルとデータベース内のユーザーベクトルとの距離が計算され[TS1] 類似度が評価されます。コサイン類似度が一定数を超えるものを表示候補とし、その中から最も高いユーザー3名が表示されます。
【リコメンドアルゴリズムの効果測定】
Twitter ユーザーを対象とした実証実験の結果、コトダマサーチによるリコメンドに対するエンゲージメント率(リコメンドにより表示された全ユーザーに対し何らかのアクション、即ちいいね、リプライ、リツイート、フォローを行った率)は 15 % を越えることが示されました。被験者が少数であるためまだ確実な結果とは言えませんが、通常の SNS におけるエンゲージメント率は概ね数 % であることを考えると、非常に高いエンゲージメント率が達成されていると言えます。
【今後の展開】
白川准教授らにより開発された「Twitter コトダマサーチ」は既存リコメンド手法に比べ非常に高いエンゲージメント率を達成しました。今回の検証は比較的小規模であり、今後更なる検証が必要ではありますが、一定以上の有効性は示されたと言えます。公開されているユーザーテキストをもとにリコメンドの対象を選別するこの手法には、将来的な発展可能性も含め、以下のようなメリットがあります。
・公開されているテキストの情報のみからリコメンドが可能であるため,ユーザーの行動履歴の多寡に影響を受けない。
・公開されているテキストの情報を用いるため,サービスを横断した、特定の SNS 内のみに限定されないリコメンドが可能となる。
・多言語対応可能な単語埋め込み(ベクトル化)アルゴリズムは既に存在しているため,本研究の手法は単一言語に限定されない(将来的には言語をまたいだリコメンデーションを可能にするサービスも開発する予定)。
・自分とは「全く似ていない・真逆の」ユーザーを検索することも可能である。それにより、敢えて自分とは異なる意見を持つ者を見つけ出し、タイムラインのエコーチェンバー化を防ぐことができると考えられる。
・(企業などの公式アカウントを運用している場合)運用アカウントのフォロワーに似ているユーザーを検索し、「潜在顧客のリスト」として用いることができる。
・「100万人に1人」の確率で似ているユーザーを検出し、極めて稀有な出会いを可能とする(同様に、「100万人に1人のアンチ」を見つけ出すことも可能である)。
株式会社フォアー[TS1] は「Twitterコトダマサーチ」の開発において、Twitterユーザーのデータベースの作成およびWEBシステム開発における技術支援をおこないました。今後も、白川准教授らのチームとの共同研究を通じて、実験規模を拡大し、更なる検証をサポートすると共に、リコメンドシステムのアップデートやサービスの機能拡充に取り組んでまいります。
Twitter コトダマサーチ
https://kotodama-search.io/
株式会社フォアーの概要
社名:株式会社フォアー
URL:https://www.fore-co.ltd/ja/
所在地:〒101-0031 東京都千代田区東神田2-8-16
GLEAMS AKIHABARA 601
設立:2017年8月
代表者:田中 悠斗
事業内容:
・AIを活用した市場分析システム等の開発及び販売
・AIやITに関するコンサルティング、データ処理に関するコンサルティング
・システム開発事業
E-mail:info@fore-co.ltd
[画像: https://prtimes.jp/i/32885/25/resize/d32885-25-f50e4f886915025d71f4-0.png ]
【背景】
近年、自然言語処理に基づくリコメンドアルゴリズムは、マーケティングツールやソーシャルネットワークをはじめとする様々な領域のサービスで活用されるようになりました。
現在、主流とされているリコメンドアルゴリズムには、個人の属性情報やテキスト情報を参照し、それらの内容が近いユーザーや商品をリコメンドする「コンテンツベースフィルタリング」や、ユーザーの嗜好と不特定多数のユーザーの嗜好記録の比較をもとにアセスメントをおこなう「協調フィルタリング」などがあり、一定の効果が認められています。
しかし、「コンテンツベースフィルタリング」「協調フィルタリング」のような手法は、活動履歴の少ないユーザーを正確に抽出できないという「コールドスタート問題」や小規模なサービスにおいて十分なユーザー情報が得られず、有効なアセスメントがしにくいという課題を抱えていました。
これらの課題に対し、長岡科学技術大学知能情報学研究室の白川智弘准教授らのチームは、文章をベクトルに変換する単語埋め込みの手法[TS1] を使用し、それにより生成されたベクトル間の距離により判定されるテキスト間の類似性からリコメンドを行う方法(※1)[TS2] を提案しており、ユーザー同士のつながりの多寡、活動履歴、サービスの規模などに依存しない形でのリコメンドシステムの研究に取り組んできました。
このリコメンドシステムの効果を測定するための実証実験(※1)では、既存リコメンド手法に比べて高いエンゲージメント率の獲得が認められたため、今回、「Twitterコトダマサーチ」としてWEBシステム化して一般公開することとなりました。
【Twitterコトダマサーチの概要】
1.データベース
株式会社 Fore- により収集された、日本人ユーザー約 2600 万人分のリスト並びにこれらのユーザーによるツイートテキストから構成されています。
2.ベクトル間距離に基づくリコメンド
Twitterコトダマサーチでは、Twitterのスクリーンネーム(@XXX)を入力すると、データベースが参照され、対象ユーザーのベクトルとデータベース内のユーザーベクトルとの距離が計算され[TS1] 類似度が評価されます。コサイン類似度が一定数を超えるものを表示候補とし、その中から最も高いユーザー3名が表示されます。
【リコメンドアルゴリズムの効果測定】
Twitter ユーザーを対象とした実証実験の結果、コトダマサーチによるリコメンドに対するエンゲージメント率(リコメンドにより表示された全ユーザーに対し何らかのアクション、即ちいいね、リプライ、リツイート、フォローを行った率)は 15 % を越えることが示されました。被験者が少数であるためまだ確実な結果とは言えませんが、通常の SNS におけるエンゲージメント率は概ね数 % であることを考えると、非常に高いエンゲージメント率が達成されていると言えます。
【今後の展開】
白川准教授らにより開発された「Twitter コトダマサーチ」は既存リコメンド手法に比べ非常に高いエンゲージメント率を達成しました。今回の検証は比較的小規模であり、今後更なる検証が必要ではありますが、一定以上の有効性は示されたと言えます。公開されているユーザーテキストをもとにリコメンドの対象を選別するこの手法には、将来的な発展可能性も含め、以下のようなメリットがあります。
・公開されているテキストの情報のみからリコメンドが可能であるため,ユーザーの行動履歴の多寡に影響を受けない。
・公開されているテキストの情報を用いるため,サービスを横断した、特定の SNS 内のみに限定されないリコメンドが可能となる。
・多言語対応可能な単語埋め込み(ベクトル化)アルゴリズムは既に存在しているため,本研究の手法は単一言語に限定されない(将来的には言語をまたいだリコメンデーションを可能にするサービスも開発する予定)。
・自分とは「全く似ていない・真逆の」ユーザーを検索することも可能である。それにより、敢えて自分とは異なる意見を持つ者を見つけ出し、タイムラインのエコーチェンバー化を防ぐことができると考えられる。
・(企業などの公式アカウントを運用している場合)運用アカウントのフォロワーに似ているユーザーを検索し、「潜在顧客のリスト」として用いることができる。
・「100万人に1人」の確率で似ているユーザーを検出し、極めて稀有な出会いを可能とする(同様に、「100万人に1人のアンチ」を見つけ出すことも可能である)。
株式会社フォアー[TS1] は「Twitterコトダマサーチ」の開発において、Twitterユーザーのデータベースの作成およびWEBシステム開発における技術支援をおこないました。今後も、白川准教授らのチームとの共同研究を通じて、実験規模を拡大し、更なる検証をサポートすると共に、リコメンドシステムのアップデートやサービスの機能拡充に取り組んでまいります。
Twitter コトダマサーチ
https://kotodama-search.io/
株式会社フォアーの概要
社名:株式会社フォアー
URL:https://www.fore-co.ltd/ja/
所在地:〒101-0031 東京都千代田区東神田2-8-16
GLEAMS AKIHABARA 601
設立:2017年8月
代表者:田中 悠斗
事業内容:
・AIを活用した市場分析システム等の開発及び販売
・AIやITに関するコンサルティング、データ処理に関するコンサルティング
・システム開発事業
E-mail:info@fore-co.ltd