kharuka2016のブログ

日々の出来事を書き留めておくブログ

pandas-データを取り出す-

入門 Python 3

入門 Python 3

目次

前提条件

OS:Windows 10 64-bit, version 1607

Anaconda 4.4.0(Python 3.6 version 64-bit)インストール

NumPyのインストール

手順概要

1.コマンドプロンプトでIPython Notebookを起動します。

2.データを取り出す

手順

1.コマンドプロンプトでIPython Notebookを起動します。

ipython notebook

2.データを取り出す

2.1.numpy、panadasとpandasからSeriesとDataFrameをインポートします。

import numpy as np
import pandas as pd
from pandas import Series,DataFrame

2.2.Seriesを作成します。

ser1=Series(np.arange(3),index=['A','B','C'])
ser1=2*ser1
ser1

Out:

A    0
B    2
C    4
dtype: int32

2.3.indexを指定してデータを取り出します。

ser1['B']

Out:

2

2.4.スライス参照してデータを取り出します。

ser1[0:3]

Out:

A    0
B    2
C    4
dtype: int32

f:id:kharuka2016:20170807164636p:plain

2.5.リストで指定してデータを取り出します。

ser1[['A','B']]

Out:

A    0
B    2
dtype: int32

2.6.条件を指定してデータを取り出します。

ser1[ser1>3]=10
ser1

Out:

A     0
B     2
C    10
dtype: int32

2.7.DataFrameを作成します。

dframe=DataFrame(np.arange(25).reshape((5,5)),index=['NYC','LA','SF','DC','Chi'],columns=['A','B','C','D','E'])
dframe

Out:

   A   B   C   D   E
NYC 0  1  2  3  4
LA  5  6  7  8  9
SF  10 11 12 13 14
DC  15 16 17 18 19
Chi 20 21 22 23 24

f:id:kharuka2016:20170807164640p:plain

2.8.indexを指定してデータを取り出します。

dframe['B']

Out:

NYC     1
LA      6
SF     11
DC     16
Chi    21
Name: B, dtype: int32

2.9.リストで指定してデータを取り出します。

dframe[['B','C']]

Out:

   B   C
NYC 1  2
LA  6  7
SF  11 12
DC  16 17
Chi 21 22

2.10.条件を指定してデータを取り出します。

dframe[dframe['C']>8]

Out:

   A   B   C   D   E
SF  10 11 12 13 14
DC  15 16 17 18 19
Chi 20 21 22 23 24

f:id:kharuka2016:20170807164647p:plain

2.11.真偽判定をします。

dframe>10

Out:

   A   B   C   D   E
NYC FALSE   FALSE   FALSE   FALSE   FALSE
LA  FALSE   FALSE   FALSE   FALSE   FALSE
SF  FALSE   TRUE    TRUE    TRUE    TRUE
DC  TRUE    TRUE    TRUE    TRUE    TRUE
Chi TRUE    TRUE    TRUE    TRUE    TRUE

f:id:kharuka2016:20170807164656p:plain

2.12.行ラベルを指定してデータを取り出します。

dframe.loc['LA']

Out:

A    5
B    6
C    7
D    8
E    9
Name: LA, dtype: int32

2.13.行indexを指定してデータを取り出します。

dframe.ix[1]

Out:index

A    5
B    6
C    7
D    8
E    9
Name: LA, dtype: int32

f:id:kharuka2016:20170807164701p:plain

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

参考:

udemy 実践Pythonデータサイエンス

www.udemy.com