「情報抽出器」が価値ある情報を探し出す!『情報抽出・固有表現抽出のための基礎知識』 発行
[20/03/30]
提供元:PRTIMES
提供元:PRTIMES
インプレスグループで理工学分野の専門書出版事業を手掛ける株式会社近代科学社は、2020年3月30日に、 『情報抽出・固有表現抽出のための基礎知識』(著者:岩倉友哉・関根 聡)を発行いたしました。
[画像: https://prtimes.jp/i/5875/3207/resize/d5875-3207-446855-0.jpg ]
●書誌情報
【シリーズ名】実践・自然言語処理シリーズ
【書名】情報抽出・固有表現抽出のための基礎知識
【著者名】岩倉 友哉・関根 聡
【編集委員】佐藤 理史・菊井 玄一郎・関根 聡・山本 和英・乾 健太郎・森 辰則
【仕様】B5変型判・並製・モノクロ・本文144頁
【本体価格】3,000円(税込3,300円)
【ISBN】978-4-7649-0610-5 C3304
【商品URL】https://www.kindaikagaku.co.jp/information/kd0610.htm
●内容紹介
社会の中で日々蓄積されていく電子データの多くは、自然言語で書かれたテキストです。これらは情報社会の伝達手段としての役割だけでなく、知識源としても注目されています。たとえば、企業、化学、医療など多岐にわたる分野の知識が、こうしたテキストの中に記載されているのです。
これらの価値ある情報をデータベースとして整理・構造化し活用するには、拡散し埋もれた情報を適切に抽出して関係づける必要があります。このプロセスを(半)自動化する技術が「情報抽出」です。その際、各分野固有の自然言語表現をいかに的確にとらえて関係づけるかが重要となります。
本書では、固有表現抽出技術と、固有表現間の関係を抽出する「関係抽出技術」に焦点を当て、機械学習などを駆使して「情報抽出器」を作るための解説を行います。
●著者紹介
岩倉友哉(いわくら ともや)
2003年 株式会社富士通研究所
2011年 東京工業大学大学院総合理工学研究科物理情報システム専攻博士課程修了 博士(工学)
2015年- 株式会社富士通研究所 主任研究員
2018年- 理化学研究所革新知能統合研究センター ユニットリーダー
関根 聡(せきね さとし)
1992年 英国マンチェスター大学計算言語学部修士号
1998年 ニューヨーク大学コンピューターサイエンス学部博士号
1998-2007 年 ニューヨーク大学研究助教授
2000年- ランゲージクラフト設立
2007年- ニューヨーク大学研究准教授
2010-2014 年 楽天技術研究所ニューヨーク所長
2017年- 理化学研究所革新知能統合研究センター チームリーダー
その他,松下電業産業株式会社(現パナソニック),ソニーCSL,マイクロソフト研究所などでの研究職を歴任.技術顧問企業多数.
●目次
第1章 情報抽出
第2章 情報抽出のためのコーパス作成
2.1 固有表現と関係の定義
2.2 アノテーションの実施
2.3 アノテーションの誤り・漏れの影響
2.4 アノテーションの品質改善
2.5 アノテーション実施時の注意点
第3章 固有表現抽出
3.1 辞書による固有表現抽出
3.2 ルールベースによる固有表現抽出
3.3 機械学習による固有表現抽出のための準備
3.4 機械学習による単語分類による固有表現抽出
3.5 線形構造学習による固有表現抽出
3.6 セミマルコフモデルによる固有表現抽出
3.7 リカレントニューラルネットワークによる固有表現抽出
第4章 関係抽出
4.1 ルールベースによる関係抽出
4.2 機械学習のための関係クラスラベルの定義
4.3 機械学習を用いた分類による関係抽出
4.4 構造学習による関係抽出
4.5 リカレントニューラルネットワークによる単語列を用いた関係抽出
4.6 リカレントニューラルネットワークによる最短依存構造パスを用いた関係抽出
第5章 評価方法
5.1 評価のためのデータの準備
5.2 固有表現抽出の評価方法
5.3 関係抽出の評価
付録
A.1 固有表現抽出・関係抽出のコーパス
A.2 固有表現抽出の補足
A.3 関係抽出の付録
A.4 情報抽出における複数タスクの学習
A.5 情報抽出におけるラベルなしテキストの利用
A.6 固有表現抽出の実装に向けて
【株式会社 近代科学社】 https://www.kindaikagaku.co.jp/
株式会社近代科学社(本社:東京都新宿区、代表取締役社長:井芹昌信)は、1959年創立。
数学・数理科学・情報科学・情報工学を基軸とする学術専門書や、理工学系の大学向け教科書等、理工学専門分野を広くカバーする出版事業を展開しています。自然科学の基礎的な知識に留まらず、その高度な活用が要求される現代のニーズに応えるべく、古典から最新の学際分野まで幅広く扱っています。また、主要学会・協会や著名研究機関と連携し、世界標準となる学問レベルを追求しています。
【インプレスグループ】 https://www.impressholdings.com/
株式会社インプレスホールディングス(本社:東京都千代田区、代表取締役:唐島夏生、証券コード:東証1部9479)を持株会社とするメディアグループ。「IT」「音楽」「デザイン」「山岳・自然」「旅・鉄道」「学術・理工学」を主要テーマに専門性の高いメデイア&サービスおよびソリューション事業を展開しています。さらに、コンテンツビジネスのプラットフォーム開発・運営も手がけています。
【お問い合わせ先】
株式会社近代科学社 出版局
TEL:03-3260-6161
電子メール: reader@kindaikagaku.co.jp