『Python Data Science Handbook』(英語の無料オンライン版あり)

『Python Data Science Handbook』は、Pythonにおけるデータサイエンスの主要なライブラリである、

NumPy pandas Matplotlib scikit-learn

について、基本的な内容がよくまとまっている良書。 Python Data Science Handbook: Essential Tools for Working with DataO'Reilly Media (2016-11-21)Amazon.co.jpで詳細を見る 文字通り、ハンドブック(手引書)として最適な一冊だと思います。入門書としてもリファレンスとしても優秀。Amazon.comのレビューでもかなりの高評価を得ている。 NumPy, pandasについては、numpy.ndarrayやpandas.DataFrameといったそれぞれのライブラリ特有の型でのデータの処理・操作方法が基礎から説明されています。 Matplotlibによるビジュアライゼーション、scikit-learnによる機械学習については、使い方の説明はもちろん以下のような具体例が豊富なビジュアル(グラフ)とともに示されています。

Matplotlib 折れ線グラフ、散布図、ヒストグラム、3Dグラフなど

scikit-learn ナイーブベイズ分類器、サポートベクターマシン、ランダムフォレスト、k近傍法など

特にMatplotlibはよく使う割にまとまった入門書が少ないので、本書は貴重な存在。クセのない英語で読みやすい。 (2018/05/27追記) 日本語版が発売された。定価4,536円。 かなりおすすめ。

『Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習』。 Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習Jake VanderPlas オライリージャパン 売り上げランキング: 13,168Amazon.co.jpで詳細を見る

無料オンライン版あり ありがたいことに原著(英語版)は全文がオンラインで公開されています。図表もそのまま載ってる。

Python Data Science Handbook | Python Data Science Handbook

Jupyter Notebook.ipynb形式のサンプルも公開されています。コードだけでなく本文も図表もすべて含まれている。以下のレポジトリのnotebooksに節ごとに分かれたファイルがあります。

jakevdp/PythonDataScienceHandbook: Python Data Science Handbook: full text in Jupyter Notebooks

GitHub上で各.ipynbファイルを開くとキレイにレンダリングして表示される。 モバイルにはKindle版がオススメ 上述のようにオンラインですべての内容が無料で読めるので基本的にはそれだけで事足りると思うが、もし移動中にスマホでも読みたいという場合はKindle版をオススメしたい。 Kindle版は固定レイアウトではなくリフロー。メモやハイライト、辞書などの機能も使える。 PCのブラウザだと、例えばMacの場合は単語を3本指タップすると辞書を表示できるが、Kindle版ならモバイルでも単語選択で辞書を表示できます。 英文を読むときに辞書はかなり便利。 お値段もKindle版は3000円弱と普通の技術書レベル。日本語版単行本(定価4,536円)よりも安い。 Python Data Science Handbook: Essential Tools for Working with DataO'Reilly Media (2016-11-21)Amazon.co.jpで詳細を見る

シェア

関連カテゴリー

本・書籍 Python pandas NumPy Matplotlib scikit-learn 機械学習

『Pythonデータサイエンスハンドブック』は良書(NumPy, pandasほか) pandas参考書『Pythonによるデータ分析入門』の注意点 pandas参考書『Python for Data Analysis, 2nd Edition』 『Pythonではじめる機械学習』は機械学習を始めたい人に最適な良書 Python, pandas, seabornでヒートマップを作成 Pythonで正規化・標準化(リスト、NumPy配列、pandas.DataFrame) Pythonでメソッドチェーンを改行して書く Pythonのリストと配列とnumpy.ndarrayの違いと使い分け scikit-learnでROC曲線とそのAUCを算出 pandas.DataFrameの各列間の相関係数を算出、ヒートマップで可視化 scikit-learnのSVMでMNISTの手書き数字データを分類 pandas.DataFrame, SeriesとNumPy配列ndarrayを相互に変換 pandasからNumPyの関数などを使う方法(pd.np) pandas, Matplotlib(mpl_finance)でローソク足チャートを作成 scikit-learnで混同行列を生成、適合率・再現率・F1値などを算出

Last Updated: 6/26/2019, 10:34:03 PM