kharuka2016のブログ

日々の出来事を書き留めておくブログ

データ解析の基礎その1-テキストデータの読み書き-

入門 Python 3

入門 Python 3

目次

前提条件

OS:Windows 10 64-bit, version 1607

Anaconda 4.4.0(Python 3.6 version 64-bit)インストール

NumPyのインストール

手順概要

1.コマンドプロンプトでIPython Notebookを起動します。

2.テキストデータの読み書き

手順

1.コマンドプロンプトでIPython Notebookを起動します。

ipython notebook

2.テキストデータの読み書き

2.1.panadasをインポートします。
import pandas as pd
2.2.jupyter notebookを起動したディレクトリ同じディレクトリにlec25.csvを配置します。CSVファイルからDataFrameを作成します。
dframe=pd.read_csv('lec25.csv')
dframe

Out:

   q   r   s   t   apple
0  2  3  4  5  pear
1  a   s   d   f   rabbit
2  5  2  5  7  dog
2.3.CSVファイルからheaderを指定してDataFrameを作成します。
dframe=pd.read_csv('lec25.csv',header=None)
dframe

Out:

   0  1  2  3  4
0  q   r   s   t   apple
1  2  3  4  5  pear
2  a   s   d   f   rabbit
3  5  2  5  7  dog
2.4.デリミッターを指定することもできます。
dframe=pd.read_csv('lec25.csv',sep=',',header=None)
dframe

Out:

   0  1  2  3  4
0  q   r   s   t   apple
1  2  3  4  5  pear
2  a   s   d   f   rabbit
3  5  2  5  7  dog
2.5.表示する行を指定できます。
pd.read_csv('lec25.csv',header=None,nrows=2)

Out:

   0  1  2  3  4
0  q   r   s   t   apple
1  2  3  4  5  pear
2.6.csvファイルとして書き出します。
dframe.to_csv('mytextdata_out.csv')

Out:

,0,1,2,3,4
0,q,r,s,t,apple
1,2,3,4,5,pear
2,a,s,d,f,rabbit
3,5,2,5,7,dog
2.7.csvファイルを標準出力します。
import sys
dframe.to_csv(sys.stdout)

Out:

,0,1,2,3,4
0,q,r,s,t,apple
1,2,3,4,5,pear
2,a,s,d,f,rabbit
3,5,2,5,7,dog
2.8.デリミッターをアンダースコアに変更します。
dframe.to_csv(sys.stdout,sep='_')

Out:

_0_1_2_3_4
0_q_r_s_t_apple
1_2_3_4_5_pear
2_a_s_d_f_rabbit
3_5_2_5_7_dog
2.9.デリミッターをタブに変更します。
dframe.to_csv(sys.stdout,sep='\t')

Out:

   0  1  2  3  4
0  q   r   s   t   apple
1  2  3  4  5  pear
2  a   s   d   f   rabbit
3  5  2  5  7  dog
2.10.標準出力する列を指定します。
dframe.to_csv(sys.stdout,columns=[0,1,2])

Out:

,0,1,2
0,q,r,s
1,2,3,4
2,a,s,d
3,5,2,5

スクリーンショット

f:id:kharuka2016:20170818132537p:plain

f:id:kharuka2016:20170818132544p:plain

f:id:kharuka2016:20170818132257p:plain

f:id:kharuka2016:20170818132302p:plain

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

参考:

udemy 実践Pythonデータサイエンス

www.udemy.com

Pythonスタートブック

Pythonスタートブック