ライブドア、バージョンアップで「livedoor ブログ検索」のスパム対策を強化
[08/10/10]
提供元:NEWS-ON
提供元:NEWS-ON
インターネット事業会社である株式会社ライブドア(本社:東京都新宿区 代表取締役社長:出澤剛)は、2008年10月10日(金)から、国内主要ブログを対象としたライブドア独自の開発検索エンジン「livedoor ブログ検索」において、スパムブログを徹底排除できるようバージョンアップしました。
今回のバージョンアップでは、類似記事や引用スパムを徹底排除し、独自の観点・意見を主張するブログにフォーカスした検索エンジンとして機能を強化しました。本機能の特長は、?livedoor Blogで培った莫大な運用データを元に作られた共通スパムフィルタ「スパムちゃんぷるー」の導入 ?その他自社独自開発による数十種類のブログ検索用スパムフィルタの導入 ?この2つのフィルタが学習機能を備えていることです。
総務省の調査によると、現在、国内のブログの総数は約1690万サイト、このうちスパムブログ※1は12%に該当するという結果※2がでています。 ブログ開設数の増加に伴い、ブログ自体のメディア価値が高まり、現在ブログは必要不可欠なサービスに成長しました。しかし、同時にスパムブログが急増し、この排除が重要課題となっています。スパムブログの増加は、ブログサービス事業者にとってはサーバ負荷を引き起こす要因となり、ブログ投稿者にとってはサーバの負荷増大によるサービスの不安定さを生じさせ、ブログ閲覧者には欲しい情報へのアクセスに時間がかかるなど、ブログに悪影響を与えています。
そこでライブドアでは、260万人のブロガーの利便性とブログ読者の有益性を最優先し、「livedoor Blog」の運用データを元に独自開発したスパムフィルタ「スパムちゃんぷるー」をバージョンアップし、今回、その機能の一部をブログ検索エンジンに採用しました。スパム対策がないとブログ検索の際、有益無益に関係なく無数のブログサイトが表示されます。しかし、今回の検索エンジンにより、スパムブログを約9割排除することが可能となり※3、有益サイトがスパムブログのために後位置に表示されることなく、上位の適切な位置に表示されます。このような精度の高い検索結果を提供することは、多くの有益な個人ブログがユーザーの目に触れやすくなり、情報のクオリティを高めるとともに、情報の重複を減らし、より幅広い情報を得ることにつながり、ユーザーの利便性を高めることとなります。
※1:スパムブログ:自動投稿による広告サイトなどに誘導することを目的とし、内容の伴わないブログ
※2:総務省情報通信政策研究所(IICP) 2008年1月現在調査データ
※3:スパムブログで狙われやすいワード3つをブログ検索にかけたときのスパムブログ率は約70%、非スパム率は約30%(スパム取りこぼし・誤判定率約10%)の結果が出ました。(自社調べ)
■ livedoor ブログ検索: http://sf.livedoor.com/
■ 「スパムちゃんぷるー」について
http://blog.livedoor.jp/techblog/archives/64943619.html
「livedoor Blog」や「livedoor Wiki」「livedoor 掲示板」などのスパム書き込みのフィルタリングを共通化するために開発したものです。これにより、スパム判定のロジックが一元化され、統計情報、ブラックリスト、ホワイトリストなどが共有できます。また、過去の判定結果から学習する機能もあります。スパム判定の基準は各サービス、あるいはユーザー毎の設定によっても変わってくるので、判定ロジックはプラグイン形式になっており、判定時にはこれらのプラグインが並列で動作する仕組みになっています。リクエスト時に必要なプラグインを指定し、任意の組み合わせで利用しています。
■ 関連URL
「livedoor Blog」トップページ
http://blog.livedoor.com/
「スパムちゃんぷるー」
http://blog.livedoor.jp/techblog/archives/64943619.html
ポータルサイト「livedoor」
http://www.livedoor.com/
■本件に関するお問い合わせ先
* 株式会社ライブドア 経営企画室 広報グループ
林 (はやし)
TEL:03-5155-0100/FAX:03-5155-0101
E-mail:press@livedoor.jp
今回のバージョンアップでは、類似記事や引用スパムを徹底排除し、独自の観点・意見を主張するブログにフォーカスした検索エンジンとして機能を強化しました。本機能の特長は、?livedoor Blogで培った莫大な運用データを元に作られた共通スパムフィルタ「スパムちゃんぷるー」の導入 ?その他自社独自開発による数十種類のブログ検索用スパムフィルタの導入 ?この2つのフィルタが学習機能を備えていることです。
総務省の調査によると、現在、国内のブログの総数は約1690万サイト、このうちスパムブログ※1は12%に該当するという結果※2がでています。 ブログ開設数の増加に伴い、ブログ自体のメディア価値が高まり、現在ブログは必要不可欠なサービスに成長しました。しかし、同時にスパムブログが急増し、この排除が重要課題となっています。スパムブログの増加は、ブログサービス事業者にとってはサーバ負荷を引き起こす要因となり、ブログ投稿者にとってはサーバの負荷増大によるサービスの不安定さを生じさせ、ブログ閲覧者には欲しい情報へのアクセスに時間がかかるなど、ブログに悪影響を与えています。
そこでライブドアでは、260万人のブロガーの利便性とブログ読者の有益性を最優先し、「livedoor Blog」の運用データを元に独自開発したスパムフィルタ「スパムちゃんぷるー」をバージョンアップし、今回、その機能の一部をブログ検索エンジンに採用しました。スパム対策がないとブログ検索の際、有益無益に関係なく無数のブログサイトが表示されます。しかし、今回の検索エンジンにより、スパムブログを約9割排除することが可能となり※3、有益サイトがスパムブログのために後位置に表示されることなく、上位の適切な位置に表示されます。このような精度の高い検索結果を提供することは、多くの有益な個人ブログがユーザーの目に触れやすくなり、情報のクオリティを高めるとともに、情報の重複を減らし、より幅広い情報を得ることにつながり、ユーザーの利便性を高めることとなります。
※1:スパムブログ:自動投稿による広告サイトなどに誘導することを目的とし、内容の伴わないブログ
※2:総務省情報通信政策研究所(IICP) 2008年1月現在調査データ
※3:スパムブログで狙われやすいワード3つをブログ検索にかけたときのスパムブログ率は約70%、非スパム率は約30%(スパム取りこぼし・誤判定率約10%)の結果が出ました。(自社調べ)
■ livedoor ブログ検索: http://sf.livedoor.com/
■ 「スパムちゃんぷるー」について
http://blog.livedoor.jp/techblog/archives/64943619.html
「livedoor Blog」や「livedoor Wiki」「livedoor 掲示板」などのスパム書き込みのフィルタリングを共通化するために開発したものです。これにより、スパム判定のロジックが一元化され、統計情報、ブラックリスト、ホワイトリストなどが共有できます。また、過去の判定結果から学習する機能もあります。スパム判定の基準は各サービス、あるいはユーザー毎の設定によっても変わってくるので、判定ロジックはプラグイン形式になっており、判定時にはこれらのプラグインが並列で動作する仕組みになっています。リクエスト時に必要なプラグインを指定し、任意の組み合わせで利用しています。
■ 関連URL
「livedoor Blog」トップページ
http://blog.livedoor.com/
「スパムちゃんぷるー」
http://blog.livedoor.jp/techblog/archives/64943619.html
ポータルサイト「livedoor」
http://www.livedoor.com/
■本件に関するお問い合わせ先
* 株式会社ライブドア 経営企画室 広報グループ
林 (はやし)
TEL:03-5155-0100/FAX:03-5155-0101
E-mail:press@livedoor.jp