kharuka2016のブログ

日々の出来事を書き留めておくブログ

実践データ解析-タイタニックその3-

入門 Python 3

入門 Python 3

目次

前提条件

  • OS:Windows 10 64-bit, version 1607

  • Anaconda 4.4.0(Python 3.6 version 64-bit)インストール

実践データ解析 目次

1. タイタニックその1

2. タイタニックその2

3. タイタニックその3

4. タイタニックその4

5. 株式市場のデータ解析入門

6. 株式市場その1

7. 株式市場その2

8. 株式市場その3

9. 株式市場その4

10. 株式市場その5

11. 選挙とデータ解析

12. 選挙その1

13. 選挙その2

14. 選挙その3

タイタニックその3

1. Kaggleの以下リンクからtrain.csvをダウンロードし、Jupyter Notebookを起動するフォルダーに配置します。

Titanic: Machine Learning from Disaster | Kaggle

2. コマンドプロンプトでJupyter Notebookを起動します。

jupyter notebook

3. 写経したソースコードGitHub Repositoryを参照してください。

github.com

4. 目標

4.1. タイタニック号の乗客はどのような人達だったのか?
4.2. それぞれの乗客はどのデッキにいたか?また、それは客室の種類とどのような関係にあったか?
4.3. 乗客は主にどこから来たのか?
4.4. 家族連れか、単身者か?
4.5. 沈没からの生還者には、どのような要因があったのか?

5 補足

5.1 このままのコードだと警告が出ます。

titanic_df['Alone'].loc[titanic_df['Alone'] >0] = 'With Family'
titanic_df['Alone'].loc[titanic_df['Alone'] == 0] = 'Alone'

Out:

C:\Users\<user name>\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\core\indexing.py:179: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  self._setitem_with_indexer(indexer, value)

5.2 警告が出るのを回避する方法

pd.options.mode.chained_assignment = None
titanic_df['Alone'].loc[titanic_df['Alone'] >0] = 'With Family'
titanic_df['Alone'].loc[titanic_df['Alone'] == 0] = 'Alone'

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

参考:

  • udemy 実践Pythonデータサイエンス

www.udemy.com

Pythonスタートブック

Pythonスタートブック