Google Colaboratoryのハンズオンを通して自然言語処理に親しもう! 『Python・Colab・NLP入門 PythonとGoogle Colaboratoryではじめる自然言語処理』
[21/10/29]
提供元:PRTIMES
提供元:PRTIMES
インプレスグループで理工学分野の専門書出版事業を手掛ける株式会社近代科学社は、2021年10月29日に、近代科学社Digitalレーベル(※)より、『Python・Colab・NLP入門 PythonとGoogle Colaboratoryではじめる自然言語処理』(著者:井田 昌之)を発行いたしました。
(※近代科学社Digitalとは : 近代科学社が著者とプロジェクト方式で協業する、デジタルを駆使したオンデマンド型の出版レーベルです、詳細はこちらもご覧ください https://www.kindaikagaku.co.jp/news/20190228.html )
[画像: https://prtimes.jp/i/5875/4164/resize/d5875-4164-2c2644beeb7fadcac474-0.jpg ]
●書誌情報
【書名】Python・Colab・NLP入門 PythonとGoogle Colaboratoryではじめる自然言語処理
【著者】井田 昌之
【仕様】B5判・並製・モノクロ・本文184頁
【印刷版基準価格】:1,800円(税抜)
【電子版基準価格】:1,440円(税抜)
【ISBN】978-4-7649- 6025-1 C3004
【商品URL】https://nextpublishing.jp/isbn/9784764960251
●内容紹介
本書はPythonを使って自然言語処理を始めようと考えている方々に対し、Google Colaboratoryを使った実践的かつプログラミングに必要な要点をまとめて紹介することをねらいとして構成しています。
テキストは簡潔かつわかりやすい記述で、重要な事項ごとにプログラミングを試すための実行例が掲載されています。
環境構築の手間がかからないGoogle Colaboratoryで手軽にプログラミングを試し、自然言語処理の習得へステップアップしていける入門書にふさわしい一冊です。
●著者紹介
井田 昌之(いだ まさゆき)
青山学院大学名誉教授
工学博士
1981年、青山学院大学大学院理工学研究科経営工学専攻博士課程修了、同年同大学理工学部助手、専任講師、助教授を経て、1988年同大学付属情報科学研究センタ研究教育開発室助教授としてキャンパスネットワーク構築。
1995年同大学国際政治経済学部へ移籍。97年同学部教授、2001年同大学大学院国際マネジメント研究科教授としてITおよびネットビジネス・EC基盤を担当。
2010年学校法人青山学院理事・副院長、2020年3月定年退職、その後、非常勤講師としてIT、Global IT、応用AI、EC関連科目を複数大学で担当、また、教育機関でのIR指導にあたる。
この間、1988年より6年間米国ANSI X3J13正員としてCommon Lisp規格制定に従事、1993年および2002年マサチューセッツ工科大学人工知能研究所客員教授、1999年Java言語仕様レビューア、フリーソフトウェア財団副理事長などを経験。商用言語処理系開発リーダ複数経験。
2005年よりIAMSCU国際教育機関連盟理事を経験。
この頃より、米国IT企業交流・起業支援ならびに新事業支援経験、ベトナムでのIT設計指導・大学教育経験多数、特に、2010年よりホーチミン自然科学大学、ハノイ工科大学にて正規科目を担当。JICA短期専門家として複数国でのIT最新技術導入を指導。
主な著書
『UNIX詳説』、丸善、1984(のちにLinux詳説として改訂、2004)
『Common Lisp』、共訳、編著、共立出版、初版1985、改訂版1991
『Common Lisp オブジェクトシステム』、共著、共立出版、1989
『キャンパスネットワーキング』、分担執筆、共立出版、1990
『AI白書』、分担執筆、コンピュータエージ社、1991
『Xウィンドウとその仲間たち』、分担執筆、共立出版、1992
『Lisp原書第3版』、共訳、培風館、1992
『はやわかりJava』、共立出版、1996
『HTML詳説』、共立出版、1999
『情報の表現』、岩波講座マルチメディア情報学分担執筆、岩波書店、2000
『オープンソースがなぜビジネスになるか』、共著、毎日コミュニケーションズ、2006
『Elements of Net Business Ethics』、Cogeime(英語)、 2009
●目次
第1章 ことはじめ
1.1 Python豆知識
1.2 Google Colaboratoryを開いてみる
1.3 インポートする:さまざまな機能はモジュールとして用意されている
1.4 ノートブックということ
1.5 インタプリタによるプログラムの実行
第2章 文法:基礎編
2.1 四則演算、変数、代入文、式、関数呼び出し、コメント
2.2 モジュール、import、モジュールにある関数の呼び出し
2.3 文字列
2.4 基本的な入出力
2.5 リストと配列、array、ndarray
2.6 条件式と判断分岐
2.7 for文による回数指定の繰り返し
2.8 while文による条件を満たす間の繰り返し
2.9 繰り返しを制御するbreak、continue、elseと多重ループ
2.10 関数を定義する
2.11 辞書型
2.12 リスト内包表記
2.13 Eval/Exec:切れ味鋭い万能関数
第3章 Google Colabに親しむ
3.1 Colabノートブックの利用
3.2 Colabでのコマンディング
第4章 モジュールに親しむ
4.1 NumPy
4.2 Pandas
4.3 グラフ表示にmatplotlibのpyplotを使う
4.4 Gensim
4.5 データセットの入手とNLTK
4.6 Scikit-learn
第5章 データファイルの読み書き
5.1 文字コードと日本語テキストデータの扱い
5.2 ファイルの読み込み
5.3 ファイルの書き込み
第6章 自然言語処理(NLP)する
6.1 NLPに便利なPythonの構文
6.2 spaCyでテキスト解析
6.3 GiNZAで、日本語テキストの形態素解析
6.4 spaCyでコサイン類似度を調べる
6.5 GiNZAで「幸福の王子」テキストの分かち書き化
第7章 WordCloudで直観を可視化
7.1 WordCloudの準備
7.2 WordCloudを実行し、画像を生成する
7.3 WordCloudに任意形を与える
第8章 トピックモデリング
8.1 LDAに取り組む
8.2 日本語テキストに対するLDAモデリング
8.3 ロイターデータセットの入門的トピックモデリング
8.4 Word2vecでトピック分析
8.5 この先の課題から
【近代科学社Digital】https://www.kindaikagaku.co.jp/kdd/index.htm
近代科学社Digitalは、株式会社近代科学社が推進する21世紀型の理工系出版レーベルです。デジタルパワーを積極活用することで、オンデマンド型のスピーディで持続可能な出版モデルを提案します。
【株式会社 近代科学社】https://www.kindaikagaku.co.jp/
株式会社近代科学社(本社:東京都千代田区、代表取締役社長:大塚浩昭)は、1959年創立。
数学・数理科学・情報科学・情報工学を基軸とする学術専門書や、理工学系の大学向け教科書等、理工学専門分野を広くカバーする出版事業を展開しています。自然科学の基礎的な知識に留まらず、その高度な活用が要求される現代のニーズに応えるべく、古典から最新の学際分野まで幅広く扱っています。また、主要学会・協会や著名研究機関と連携し、世界標準となる学問レベルを追求しています。
【インプレスグループ】https://www.impressholdings.com/
株式会社インプレスホールディングス(本社:東京都千代田区、代表取締役:松本大輔、証券コード:東証1部9479)を持株会社とするメディアグループ。「IT」「音楽」「デザイン」「山岳・自然」「モバイルサービス」「学術・理工学」「旅・鉄道」を主要テーマに専門性の高いメディア&サービスおよびソリューション事業を展開しています。さらに、コンテンツビジネスのプラットフォーム開発・運営も手がけています。
【お問い合わせ先】
株式会社近代科学社
TEL:03-6837-4828
電子メール: kdd-qa@kindaikagaku.co.jp