kharuka2016のブログ

日々の出来事を書き留めておくブログ

pandas-形の違うデータの計算-

入門 Python 3

入門 Python 3

目次

前提条件

OS:Windows 10 64-bit, version 1607

Anaconda 4.4.0(Python 3.6 version 64-bit)インストール

NumPyのインストール

手順概要

1.コマンドプロンプトでIPython Notebookを起動します。

2.形の違うデータの計算

手順

1.コマンドプロンプトでIPython Notebookを起動します。

ipython notebook

2.形の違うデータの計算

2.1.numpy、panadasとpandasからSeriesとDataFrameをインポートします。

import numpy as np
import pandas as pd
from pandas import Series,DataFrame

2.2.Seriesを作成します。

ser1=Series([0,1,2],index=['A','B','C'])
ser1

Out:

A    0
B    1
C    2
dtype: int64
ser2=Series([3,4,5,6],index=['A','B','C','D'])
ser2

Out:

A    3
B    4
C    5
D    6
dtype: int64

f:id:kharuka2016:20170807191907p:plain

2.3.Seriesの和を求めます。

ser1+ser2

Out:

A    3.0
B    5.0
C    7.0
D    NaN
dtype: float64

2.4.DataFrameを作成します。(リスト内包表記)

dframe1=DataFrame(np.arange(4).reshape((2,2)),columns=list('AB'),index=['NYC','LA'])
dframe1

Out:

   A   B
NYC 0  1
LA  2  3

2.5.DataFrameを作成します。

dframe=DataFrame(np.arange(4).reshape((2,2)),columns=['A','B'],index=['NYC','LA'])
dframe

Out:

   A   B
NYC 0  1
LA  2  3

f:id:kharuka2016:20170807191912p:plain

2.6.DataFrameを作成します。(リスト内包表記)

dframe2=DataFrame(np.arange(9).reshape((3,3)),columns=list('ADC'),index=['NYC','SF','LA'])
dframe2

Out:

   A   D   C
NYC 0  1  2
SF  3  4  5
LA  6  7  8

2.7.DataFrameの和を求めます。

dframe1+dframe2

Out:

   A   B   C   D
LA  8  NaN NaN NaN
NYC 0  NaN NaN NaN
SF  NaN NaN NaN NaN

2.8.DataFrameの和を求めます。(fill_value=0を指定することで、dframe1 or dframe2のどちらかに値があれば0を代入します。)

dframe1.add(dframe2,fill_value=0)

Out:

   A   B   C   D
LA  8  3  8  7
NYC 0  1  2  1
SF  3  NaN 5  4

f:id:kharuka2016:20170807191916p:plain

2.9.DataFrameの行indexを指定してSeriesに代入します。

ser3=dframe2.ix[0]
ser3

Out:

A    0
D    1
C    2
Name: NYC, dtype: int32

2.10.DataFrameとSeriesの引き算をします。

dframe2-ser3

Out:

 A   D   C
NYC 0   0   0
SF  3   3   3
LA  6   6   6

f:id:kharuka2016:20170807191920p:plain

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

参考:

udemy 実践Pythonデータサイエンス

www.udemy.com