pandas参考書『Python for Data Analysis, 2nd Edition』

pandasの開発者Wes Mckinney氏による『Python for Data Analysis』の第2版。 Python for Data Analysis: Data Wrangling with Pandas, Numpy, and IPythonWes Mckinney Oreilly & Associates Inc Amazon.co.jpで詳細を見る 2018年7月26日に日本語版『Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理』も発売されました。 Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理Wes McKinney オライリージャパン Amazon.co.jpで詳細を見る 原著第1版は2012年10月発売と古く、サンプルコードが最新バージョンのライブラリに対応していなかった。

原著第2版は2017年10月発売で、発売時点の最新バージョンのライブラリに対応しています。 なお、pandasの開発者が書いた本ということでpandasについての詳しさは随一だが、NumPy, matplotlibの分量は少なめ。NumPy, pandas, matplotlibを基礎からバランスよく学びたい人には『Python Data Science Handbook』、およびその日本語版『Pythonデータサイエンスハンドブック』もオススメ。

以下、第1版からの変更点などについて。

GitHubのサンプルコード 第1版からの変更点 Python, 各ライブラリのバージョンアップ 内容追加 全体の構成見直し こんな人にオススメ pandas本を探しているならコレ 第1版を持っている人は買うべきか?

GitHubのサンプルコード

GitHubでJupyter Notebook.ipynb形式のサンプルコードが公開されています。

wesm/pydata-book: Materials and IPython notebooks for "Python for Data Analysis" by Wes McKinney, published by O'Reilly Media

日本語の第1版『Pythonによるデータ分析入門』を持っている人は英語が苦手でもサンプルコードにざっと目を通してみるといいと思います。構成が若干変わっているので第1版の章と対応しているわけではないが、Jupyter Notebook(.ipynb)で一通り実行してみると、知らない書き方やメソッドの勉強になるだろう。

第1版からの変更点

Python, 各ライブラリのバージョンアップ

サンプルコードに使われているPythonのバージョンが3.6、pandasのバージョンが0.20.3に更新されました。 Updated for Python 3.6 Updated for latest pandas (0.20.3) Python for Data Analysis Book - Wes McKinney 第1版のサンプルコードを最新バージョンでそのまま実行するとエラーや警告が発生していたので、これだけでも価値があります。

内容追加

サンプルコードが更新されているのに加え、以下の章が新たに追加されました。 Pythonの基本的な文法 Pythonの基本的な文法の説明が追加されました。リストやタプルの操作などが一通り説明されています。

2章 Pythonの基礎、IPythonとJupyter Notebook 3章 Python組み込みのデータ構造と関数、ファイルの扱い

応用編(Advanced pandas) pandasの応用編(Advanced pandas)としてカテゴリ型やpipe()メソッドなどについての説明が追加されました。分量はそれほど多くない。

12章 pandas:応用編

モデリングライブラリ こちらも分量はあまり多くないが、以下のモデリングライブラリについて説明されています。

13章 Pythonにおけるモデリングライブラリ入門 patsy stats-models

scikit-learn全体の構成見直し

章が再構成され、見通しが良くなりました。 第1版では各章にバラバラに配置されていた実際のデータを使った例が14章にまとめられています。内容は第1版と同じ。

こんな人にオススメ

pandas本を探しているならコレ

pandasの開発者が書いた本なのでpandasについての詳しさは随一。 pandasについて詳しく書かれている本を探しているならこれで間違いません。日本語版もあります。 Python for Data Analysis: Data Wrangling with Pandas, Numpy, and IPythonWes Mckinney Oreilly & Associates Inc Amazon.co.jpで詳細を見る Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理Wes McKinney オライリージャパン Amazon.co.jpで詳細を見る

第1版を持っている人は買うべきか?

第1版を今でもたびたび参照していてそのたびにpandasのバージョンが古くてイライラしている、というのであれば、迷わず第2版を買ったほうが幸せになれる。 ただし、上述のようにサンプルコードが新しいバージョンに対応するよう更新されているものの、内容が大幅に追加されているわけではない。 第1版を持っているのであれば第2版を新たに買い直さなくてもGitHubのサンプルコードを実行して復習するだけで事足りるかもしれない。気になるところがあれば買えばいいし、一度確認してみるといいと思います。

wesm/pydata-book: Materials and IPython notebooks for "Python for Data Analysis" by Wes McKinney, published by O'Reilly Media

第1版を持っているので第2版を買うほどではない…だけど新しいバージョンのpandasに対応した参考書は欲しい、というのであれば『Pythonデータサイエンスハンドブック』がオススメ。pandasについても基本操作を中心に簡潔にまとめられています。

Last Updated: 6/26/2019, 10:34:03 PM