リクルートキャリア運営の「CodeIQ」で出題を開始しました。 〜第一弾は「PHPを使った機械学習の問題」〜
[14/12/01]
提供元:DreamNews
提供元:DreamNews
PHPを使った機械学習ソリューションを推進している、学びing株式会社(本社:さいたま市浦和区、代表取締役社長:斉藤常治)は、2014/12/1(月)より、リクルートキャリアが運営するITエンジニアのための実務スキル評価サービス「CodeIQ(コードアイキュー)」でプログラミングの出題を開始しました。
2014年7月に書籍「PHPによる機械学習入門」を執筆した、学びingのプログラミング好きの著者が「CodeIQ」のファンだったのが縁で今回の取り組みを行うことになりました。
機械学習に関心のあるエンジニアの皆様が、出題された問題を解くことによって自身のスキルを測ることができます。多くの方の挑戦をお待ちしています!
【設問内容】
この問題では、PHPを使って、内容が似ている記事を見つけてもらいます。
具体的には、アニメ・マンガに関する『クイズ記事』の中から、内容が似ているものどうしをプログラムで探してもらいます。
この『クイズ記事 』は、弊社が運営する日本一のクイズサイト「けんてーごっこ( http://kentei.cc/ )」から無作為に抽出したものです。
機械学習に関心のあるエンジニアの皆様、是非挑戦してみてください!
【ヒント】
・この問題は、自然言語処理の問題です。形態素解析処理は必須になります。MeCab を必ず使って下さい。
・クイズ記事同士が似ているかどうかを数字で計算することになります。テキストクラスタリングで使われる類似度の計算方法を使うと良いでしょう。
・クイズ記事同士の類似度を計算する場合、クイズ記事をベクトルに変換する必要があります。ベクトルを連想配列の形で表すと、処理がしやすいでしょう。
・クイズ記事のベクトルの各要素は、単語とそのTF-IDF値で表すと良いでしょう。
・書籍「PHPによる機械学習入門」では、この問題にかなり近い内容を解説しています。第4章のテキストクラスタリングの部分(P304〜P408)を読むと、大きなヒントになるでしょう。
【出題URL】
https://codeiq.jp/ace/takahashi_yuukou/q1155
【CodeIQとは】
第一線で活躍するITエンジニアが出題した問題に一般ユーザーが無料で“挑戦”し、その解答に対して出題エンジニアから評価フィードバックをもらえるサービスです。社会一般から見たITスキルではなく、その出題エンジニアに自分のスキルがどのように評価されるのかを知ることができます。
【学びing株式会社について】
・書籍執筆:「PHPによる機械学習入門」「Amazon EC 2/S3クラウド入門」「図解Q &Aクラウド事典」
・「PHP機械学習フォーラム」、関連トレーニング、セミナーの主催
・独自のA I(人工知能)や機械学習技術を使ったシステム提供、データの分析やコンサルティング
・400万問!検定(クイズ)数日本一の「けんてーごっこ」( http://kentei.cc/ )
・データを見ながら宿を予約できる「激戦予約.com」( http://gekisen-yoyaku.com/ )
【本件に関するお問い合わせ先】
学びing株式会社
担当:斉藤/高橋
電話番号:048-813-8207
e-mail:sales@manabing.jp
2014年7月に書籍「PHPによる機械学習入門」を執筆した、学びingのプログラミング好きの著者が「CodeIQ」のファンだったのが縁で今回の取り組みを行うことになりました。
機械学習に関心のあるエンジニアの皆様が、出題された問題を解くことによって自身のスキルを測ることができます。多くの方の挑戦をお待ちしています!
【設問内容】
この問題では、PHPを使って、内容が似ている記事を見つけてもらいます。
具体的には、アニメ・マンガに関する『クイズ記事』の中から、内容が似ているものどうしをプログラムで探してもらいます。
この『クイズ記事 』は、弊社が運営する日本一のクイズサイト「けんてーごっこ( http://kentei.cc/ )」から無作為に抽出したものです。
機械学習に関心のあるエンジニアの皆様、是非挑戦してみてください!
【ヒント】
・この問題は、自然言語処理の問題です。形態素解析処理は必須になります。MeCab を必ず使って下さい。
・クイズ記事同士が似ているかどうかを数字で計算することになります。テキストクラスタリングで使われる類似度の計算方法を使うと良いでしょう。
・クイズ記事同士の類似度を計算する場合、クイズ記事をベクトルに変換する必要があります。ベクトルを連想配列の形で表すと、処理がしやすいでしょう。
・クイズ記事のベクトルの各要素は、単語とそのTF-IDF値で表すと良いでしょう。
・書籍「PHPによる機械学習入門」では、この問題にかなり近い内容を解説しています。第4章のテキストクラスタリングの部分(P304〜P408)を読むと、大きなヒントになるでしょう。
【出題URL】
https://codeiq.jp/ace/takahashi_yuukou/q1155
【CodeIQとは】
第一線で活躍するITエンジニアが出題した問題に一般ユーザーが無料で“挑戦”し、その解答に対して出題エンジニアから評価フィードバックをもらえるサービスです。社会一般から見たITスキルではなく、その出題エンジニアに自分のスキルがどのように評価されるのかを知ることができます。
【学びing株式会社について】
・書籍執筆:「PHPによる機械学習入門」「Amazon EC 2/S3クラウド入門」「図解Q &Aクラウド事典」
・「PHP機械学習フォーラム」、関連トレーニング、セミナーの主催
・独自のA I(人工知能)や機械学習技術を使ったシステム提供、データの分析やコンサルティング
・400万問!検定(クイズ)数日本一の「けんてーごっこ」( http://kentei.cc/ )
・データを見ながら宿を予約できる「激戦予約.com」( http://gekisen-yoyaku.com/ )
【本件に関するお問い合わせ先】
学びing株式会社
担当:斉藤/高橋
電話番号:048-813-8207
e-mail:sales@manabing.jp