実践データ解析-タイタニックその4-
- 作者: Bill Lubanovic,斎藤康毅,長尾高弘
- 出版社/メーカー: オライリージャパン
- 発売日: 2015/12/01
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (3件) を見る
目次
- 前提条件
- 実践データ解析 目次
- タイタニックその4
- 参考:
前提条件
実践データ解析 目次
1. タイタニックその1
2. タイタニックその2
3. タイタニックその3
4. タイタニックその4
5. 株式市場のデータ解析入門
6. 株式市場その1
7. 株式市場その2
8. 株式市場その3
9. 株式市場その4
10. 株式市場その5
11. 選挙とデータ解析
12. 選挙その1
13. 選挙その2
14. 選挙その3
タイタニックその4
1. Kaggleの以下リンクからtrain.csvをダウンロードし、Jupyter Notebookを起動するフォルダーに配置します。
Titanic: Machine Learning from Disaster | Kaggle
2. コマンドプロンプトでJupyter Notebookを起動します。
jupyter notebook
3. 写経したソースコードはGitHub Repositoryを参照してください。
4. 目標
4.1. タイタニック号の乗客はどのような人達だったのか?
男性が多かった。
3等客室の男性が非常に多かった。
3等客室になるにつれ子供の乗客数が多かった。
21歳と30歳の乗客が多かった。
乗客の平均年齢は29.7歳であった。
子供の乗客数が一番少なかった。
2~3歳の子供の乗客数が多かった。
年齢が高くなるにつれ客室の等級も上がっていた。
Qから乗船した客は3等客室の人が多かった。
4.2. それぞれの乗客はどのデッキにいたか?また、それは客室の種類とどのような関係にあったか?
- 各乗客のいたデッキ
Cabin 0 C 1 C 2 E 3 G 4 C 5 D 6 A 7 C 8 B 9 D 10 B 11 C 12 B 13 C 14 F 15 F 16 C 17 E 18 A 19 D 20 D 21 C 22 B 23 E 24 D 25 F 26 D 27 C 28 B 29 F ... ... 174 E 175 B 176 B 177 D 178 E 179 F 180 B 181 B 182 D 183 B 184 D 185 B 186 A 187 E 188 B 189 B 190 E 191 B 192 E 193 C 194 C 195 D 196 E 197 D 198 A 199 D 200 B 201 C 202 B 203 C 204 rows × 1 columns
3等客室の乗客はBとCデッキに集まっていた。
1等客室の乗客はCデッキに集まっていた。
Cデッキはカジノのフロア若しくはダンスフロア?
4.3. 乗客は主にどこから来たのか?
- Sから乗船した客が多かった。
4.4. 家族連れか、単身者か?
- 家族連れよりも単身者の方が多かった。
4.5. 沈没からの生還者には、どのような要因があったのか?
1等客室の乗客の生存率が高かった。
女性・子供の生存率が高かった。
年齢が若いほど生存率が高かった。
4.6. 乗客が居たデッキは生存率と関係あるか?また、その答えは感覚的な答えと合うだろうか?
ある。1、2等客室の乗客はGデッキ寄りの方が生存率が高く3等客室の乗客はGデッキ寄りの方が生存率が低い。
合う。1、2等客室の乗客を優先して救助したため、3等客室の乗客は逃げ遅れたと思われる。
4.7. 家族連れであることは、事故からの生還率を上げているだろうか?
- 家族連れの方が生存率が高い。
Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
- 作者: Andreas C. Muller,Sarah Guido,中田秀基
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/05/25
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
参考:
- udemy 実践Pythonデータサイエンス
- 作者: 辻真吾
- 出版社/メーカー: 技術評論社
- 発売日: 2010/04/24
- メディア: 大型本
- 購入: 19人 クリック: 199回
- この商品を含むブログ (59件) を見る