kharukaのブログ~お金と技術とキャリア~

Edu Fin~金融×教育~若いうちからお金について学ぶってだいじ!自分が学んだテクノロジーはみんなの財産!過去、今、将来の人生!についてのブログ

データ解析の基礎その3-データをまとめるGroupByその2-

入門 Python 3

入門 Python 3

目次

前提条件

OS:Windows 10 64-bit, version 1607

Anaconda 4.4.0(Python 3.6 version 64-bit)インストール

データ解析の基礎 その3 目次

1. データをまとめるGroupBy

2. データをまとめるGroupByその2

3. データのAggregation

4. Split、Apply、Combining

5. クロス集計

データをまとめるGroupByその2

1. コマンドプロンプトでJupyter Notebookを起動します。

jupyter notebook

2. 写経したソースコードGitHub Repositoryを参照してください。

github.com

3. 補足

3.1. ixではなくlocを使用します。
animals.loc[1:2,['W','Y']]=np.nan
3.2. keys=['A','B','A','B']ではなくkeys=['A','A','A','B']を使うとmaxの意味がわかりやすいです。行の[0]番目と[1]番目で大きい方の値が出力されています。

keys=['A','B','A','B']の場合

keys=['A','B','A','B']
animals.groupby([len,keys]).max()

Out:

     W   X   Y   Z
3   A   0   1   2   3
    B   NaN 5   NaN 7
4   A   8   9   10  11
5   B   12  13  14  15

keys=['A','A','A','B']の場合

keys=['A','A','A','B']
animals.groupby([len,keys]).max()

Out:

     W   X   Y   Z
3   A   0   5   2   7
4   A   8   9   10  11
5   B   12  13  14  15

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

参考:

  • udemy 実践Pythonデータサイエンス

www.udemy.com

Pythonスタートブック

Pythonスタートブック