kharukaのブログ~お金と技術とキャリア~

Edu Fin~金融×教育~若いうちからお金について学ぶってだいじ!学んだテクノロジーはみんなの財産。過去、現在、将来の人生についてのブログ

データの可視化-カーネル密度推定-

入門 Python 3

入門 Python 3

目次

前提条件

  • OS:Windows 10 64-bit, version 1607

  • Anaconda 4.4.0(Python 3.6 version 64-bit)インストール

  • Seabornのインストール

データ解析の基礎 その3 目次

1. Seabornのインストール

2. ヒストグラム

3. カーネル密度推定

4. 分布の可視化

5. ボックスとプロットとバイオリンプロット

6. 回帰とプロット

7. ヒートマップとクラスタリング

カーネル密度推定

1. コマンドプロンプトでJupyter Notebookを起動します。

jupyter notebook

2. 写経したソースコードGitHub Repositoryを参照してください。

github.com

3. 補足

3.1. カーネル密度推定とは?

ざっくりとした例で言うと、カーネル密度推定とは出口調査により選挙結果を予測することです。

3.2. sns.kdeplot(dframe)は非推奨Warnningが出るため、取り敢えずsns.kdeplot(dframe.X,dframe.Y)で回避することにします。正しい回避策かは調査中。
dframe=pd.DataFrame(dataset2,columns=['X','Y'])
sns.kdeplot(dframe)

Out:

C:\Users\<user name>\AppData\Local\Continuum\Anaconda3\lib\site-packages\seaborn\distributions.py:630: UserWarning: Passing a 2D dataset for a bivariate plot is deprecated in favor of kdeplot(x, y), and it will cause an error in future versions. Please update your code.
  warnings.warn(warn_msg, UserWarning)

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

参考:

  • udemy 実践Pythonデータサイエンス

www.udemy.com

カーネル密度推定 - Wikipedia

  • Kernel density estimation

Kernel density estimation - Wikipedia

  • Kernel (statistics)

Kernel (statistics) - Wikipedia

  • seaborn.kdeplot

seaborn.kdeplot — seaborn 0.8.1 documentation

Pythonスタートブック

Pythonスタートブック