kharukaのブログ~お金と技術とキャリア~

Edu Fin~金融×教育~若いうちからお金について学ぶってだいじ!自分が学んだテクノロジーはみんなの財産!過去、今、将来の人生!についてのブログ

gacco 「社会人のためのデータサイエンス入門」 Week 3 データの見方 part 1

データサイエンティスト養成読本 登竜門編

データサイエンティスト養成読本 登竜門編

▼gacco 「社会人のためのデータサイエンス入門」 Week 2 統計学の基礎 part 2 はこちらです。

(執筆中です。)

3-1. 統計表の見方

第3週のねらい

①現実のデータの詳細

統計表などですね。

②データを見るうえでの注意点

ここは大事なとこですよー。

③簡単な分析の仕方

統計データの分類

クロスセクションデータ(横断的データ)
  • 時点を固定した時の様々な分類のデータ

  • 地域別データが代表的。データの並ぶ順番に意味はない。

例)2014年1月1日時点の各都道府県の人口データ

時系列データ
  • 同じ分類で時点が異なるデータ

  • データは並び順は通常、古いー>新しい、順になることが多い。

例)東京都の1981年から2014年までの人口データ

パネルデータ
  • 各分類の各時点のデータ

  • 大規模なデータになることが多い。

例)各都道府県の1981年から2014年までの人口データ

分類について

統計表によくみられる「製造業」や「商業」などの産業分類や職業の分類のことを質的分類といい、標準化が設定されています。

各統計間で定義が異なると、比較が大変ですよね。

だから、質的分類により標準統計分類が設定されています。

以下が定められています。

  1. 分類の原則

  2. 分類の構成

3-2. 比率の見方①-クロスセクションデータ

比率

総数が異なる

-> 実数同士では正しい比較にならない

-> 総数に占める比率で比較

-> 構成比

2つの比率

構成比

構成比は総数とその内訳の比率

(例) 15歳未満人口割合= (15歳未満の人数)/(総人口)

一つの集団のデータ(一つの県のデータなど)を扱うときは構成比を使うのですね。

相対比

異なるデータを分子、分母に取った比率

(例) 人口密度= (人口)/(面積)

一人当たり県民所得=(総県民所得)/(人口)

異なる集団のデータ(他県同士のデータなど)を比較するときは相対比を使うのですね。

相対比を使う時のポイント

集団の相互比較 -> 各集団の大きさの影響を除去

東京の面積と北海道の面積は全然異なるので、両者のコンビニの件数が例え同じだとしても

北海道ではコンビニが50m歩くごとに見つかるとは思えないですもんね。

決して北海道をバカにしている訳ではないですよ。例え話です。

分母と分子の対応に注意しましょう。

データの意味が変わって来ますからね。

3-3. 比率の見方②-使い方と注意点

相関係数

縦軸を女性数、横軸を総人口(都道府県の人口では?)とすると

都道府県の人口の規模の強い影響を受けて、女性数と都道府県の人口が正の相関関係にあるようにみえます。

しかし、これは正しい分析でしょうか?

比率の相関係数

縦軸を女性の比率、横軸を都道府県の人口とすると

相関係数 = -0.51から判断すれば、人口の多い都道府県ほど女性の割合が高いとは言えませんね。

どうやら女性の割合が多かったり、少なかったりする都道府県があるようですね。

比率の相関係数を使う時の注意点

同じ変数(都道府県の人口)を分母とする構成比同士の相関係数では、変数(都道府県の人口)が1つ減っていることに注意しましょう。

男性の比率と女性の比率の関係は直感的にも負の相関係数になりそうですよね?

▼記事の続きは以下へ。

(執筆中です。)

岩波データサイエンス Vol.1

岩波データサイエンス Vol.1

参考

今週の割安株投資パフォーマンス(2018/6/16)2018年6月17日更新

株式投資を学ぶならファイナンシャルアカデミー

久しぶりの執筆再開

最近執筆をサボっていました。

体調が悪い、忙しいを言い訳に。

反省してます。

健康、時間の問題も自己コントロールが出来ていない証拠。

継続は力なりと言いますから

途中で足を止めることがあっても

最後まで諦めないことが肝心です。

コメント

米ドル/円が110円代まで回復。

円安を追い風に日経平均株価も上昇トレンドに。

FRBの年内2度目の利上げ米国の対中国関税による貿易摩擦懸念からNYダウは下落したが、

日経平均株価はNYダウに連動せず。

そろそろ配当金や優待品が届く頃ですね。

楽しみ〜!

保有銘柄評価

シノブフーズ(優待)

業績は堅調に伸びてはいますが、連18.3は予想よりもだいぶ業績が悪かったですね。

優待品の海苔は有り難く頂きました。

第48期定時株主総会招集ご通知

第1議案 剰余金処分の件

(略) この方針のもと、当期の期末配当は7円50銭とさせていただきたく存じます。なお、中間配当として7円50銭をお支払いしておりますので、当期の年間配当は1株につき15円となります。

今後もファミリーマートさんと頑張って、着実に利益を伸ばして欲しいですね。

配当性向は30%は欲しいところ。

業績 売上高 営業利益 経常利益 純利益 1株益 1株配
連18.3 47,300(47,500) 1,032(1,080) 1,034(1,080) 692(760) 54.7(60.3) 15
連19.3予 48,000(49,000) 1,050(1,200) 1,050(1,200) 720(840) 56.9(66.6) 15
連20.3予 48,900 1,080 1,080 740 58.5 15

リケンテクノス

4期連続増配は素晴らしいです!

光学フィルムは大型テレビなどに使われているので、オリンピック特需の恩恵にあやかりたいですね。

まだまだ伸び代があるので今後に期待です。

業績 売上高 営業利益 経常利益 純利益 1株益 1株配
連18.3予 94,601(94,000) 5,399(5,300) 5,410(5,400) 2,538(2,600) 41.6(41.4) 12
連19.3予 100,000 6,300(6,000) 6,400(6,100) 3,040(2,930) 47.4(46.6) 13(12~13)
連20.3予 103,000 6,500 6,600 3,140 49.0 14

以下、執筆中。

ヤマシナ

トーソー(優待)

トーアミ

三精テクノロジー

イオンモール(優待)

カドカワ(優待)

中国電力

蔵王産業

保有銘柄

国内株式

証券コード 銘柄
2903 シノブフーズ
4220 リケンテクノス
5955 ヤマシナ
5956 トーソー
5973 トーアミ
6357 三精テクノロジー
8905 イオンモール
9468 カドカワ
9504 中国電力
9986 蔵王産業

投資信託

証券コード 銘柄
79312021 三井住友・日本債券インデックス・ファンド
91312179 楽天・全米株式インデックス・ファンド
91311179 楽天・全世界株式インデックス・ファンド

パフォーマンス

+532,582円

株式投資の始め方

株式投資を始める方は是非こちらも合わせてご覧ください。

kharuka2016.hatenablog.com

参考

【投資】【年高】中国電力が年初来高値更新。

コメント

またまた中国電力が年初来高値更新です。

三精テクノロジーに続き続伸に期待です。カドカワも意外に奮闘しています。笑

中国電力が1,200円/株あたりを行き来していたのが嘘のようですね。

ただの高配当株からの脱却。

当面は2016年12月12日の 1,479円/株を超えられるかどうかがカギですね。

2年チャートの形を見ると難なく1,479円/株を超えてくれそうです。

明日は四季報の発売日!

待ち遠しいですね。週末の企業研究が楽しみで仕方がないです。

証券コード 銘柄
2903 シノブフーズ
4220 リケンテクノス
5955 ヤマシナ
5956 トーソー
5973 トーアミ
6357 三精テクノロジー
8905 イオンモール
9468 カドカワ
9504 中国電力
9986 蔵王産業

株式投資を始める方はこちらも是非!

kharuka2016.hatenablog.com

参考

  • なし

はじめての IoT ~ Google Home Mini でビールを注文してみる(LINE編) ~(2018年6月9日執筆)

前置き

本人の強い希望によりR氏からL氏に変更しました。笑

デスノートみたい?

突然友達からおもろそうなメッセージがきた。

L氏「私のGoogle Home Miniでなんか作ろうかと友達が言い出して、まだ具体的な案はないけど、もし興味あったら参加してくれそう?」

私「参加するー。X月X日X時からピンポイントで予定空いてたわ。笑」

L氏「ありがとう!未来のデータサインティストに参加してもらえると心強いね〜笑

詳細が決まったらまた連絡するね!」

私「やろうとしていることはどっちかっていうとIoTちゃう?笑

連絡待ってます!」

L氏「そうね、個人的に、最近出た音声でオーダーできるシステムなどもいいかなーって。私は作れないけど、笑σ(^_^;)

また後日でー」

そんなおもろそうなイベントもちろん参加するやん!

フッカル*1。一度使ってみたかっただけです。すみません。

そんなザックリした会話でIoTハンズオンをやることになったので、久々にArduinoを引っ張り出してきた。この子役に立つかも?

なんか嫌な予感がしたので

Google Home Mini に話しかけたら(注文したら)何かしらの方法でアウトプット出来る方法を下調べしました。

因みに、L氏から「詳細が決まったらまた連絡するね!」の詳細が決まった連絡は無かった。。。

そんなゆるい感じでやってます。笑

前提条件

システムのファームウェアバージョン:118652

Castのファームウェアバージョン:1.32.118652

言語:日本語

Google Home

Google Home

【準備事項】

  • Googleアカウント登録

  • LINEアカウント登録

  • Google Homeのインストール

開発当日

私を含め、言い出しっぺのM氏、誘ってくれたL氏、初めましてのI氏の計4名で

Google Home Mini でなんか作ることになりました。

なんかってなんや?笑

開発スペースはヤフー株式会社様が無料で提供されている「LODGE」をお借りました。

初「LODGE」デビュー!

全くもってシャレオツなオフィスですわ。羨ましい限りです。

LODGEとは?

みんなで「!」を生み出す場所

東京のど真ん中、アクセス抜群の好立地に、 Yahoo! JAPANのオープンコラボレーションスペース「LODGE」が誕生しました。 広さは1,330平方メートル。開放感にあふれ、窓からの展望も素晴らしい空間です。

オープンなコラボレーションを生むため、 利用者同士を結び付けるコミュニケーター制度を導入。 情報交換や新たな協業を生み出していける仕組みを作りました。 Yahoo! JAPANとの事業に親和性を感じる方、地方創生を目指す方、 スタートアップ企業の方、何か面白いことがしたい方、・・・ ここはそんなあなたに来てほしい場所です。

初めましてのI氏もおりましたので簡単に自己紹介を済ませ本題に入ることに。

私「一応Arduino持ってきたんでLチカとかも出来ますよー。」

M氏「Lチカやりたい!

私「ですよねー!ただ今回はR氏から音声でオーダーできるシステム作りたいって聞いてたから、また手軽に始められそうなのでLINEにオーダーのアウトプットを出力することにしましょう。」

というぬるーい感じで開発スタートです。

こんなんで音声でオーダーできるシステムは作れるのか?笑

環境構築

L氏の Google Home Mini のご機嫌が斜めで開発が進まない。笑

Google Home Mini を使った開発をする際は、ちゃんとしたネットワーク環境が必要ということと雑音が少ない場所で開発した方が良いということを身を持って経験しました。

マルチユーザー登録どころかL氏の声にそもそも Google Home Mini が反応しない。泣

スマートフォンにインストールしたGoogle Homeアプリを起動し

メニュー > デバイス

で対象のデバイスにアカウントをリンクさせます。

何とか私のアカウントを Google Home Mini にリンクすることに成功。

ほぼコレに時間を費やしました。泣

L氏ありがとう!

構成

IFTTT helps your apps and devices work together

IFTTTとは? 異なるプラットフォームを連携する便利ツール

  • LINE

Google Home Mini(インプット) → IFTTT(連携) → LINE(アウトプット)

開発手順

1. IFTTT に Google Home Mini にリンクしているアカウントでサインインし、MyAppletsをクリックします。

f:id:kharuka2016:20180610012419p:plain

2. New Applet をクリックします。

f:id:kharuka2016:20180610012423p:plain

3. +thisをクリックします。

f:id:kharuka2016:20180610012427p:plain

4. googleと検索して、Google Assistantをクリックします。

f:id:kharuka2016:20180610012431p:plain

5. Connectをクリックします。

f:id:kharuka2016:20180610012435p:plain

6. Google Home Mini にリンクしているアカウントを選択します。

f:id:kharuka2016:20180610012439p:plain

7. 許可をクリックします。

f:id:kharuka2016:20180610012443p:plain

8. Say a phrase with a numberをクリックします。

f:id:kharuka2016:20180610012447p:plain

9. What do you want to say?にビールを # 杯下さいと入力します。

f:id:kharuka2016:20180610012451p:plain

10. What do you want the Assistant to say in response?にLineにビールを # 杯注文しました。と入力し、LanguageはJapaneseを選択します。Create triggerをクリックします。

f:id:kharuka2016:20180610012455p:plain

11. +thatをクリックします。

f:id:kharuka2016:20180610012458p:plain

12. lineと検索して、LINEをクリックします。

f:id:kharuka2016:20180610012502p:plain

13. Connectをクリックします。

f:id:kharuka2016:20180610012505p:plain

14. LINEのメールアドレスとパスワードを入力してログインをクリックします。

f:id:kharuka2016:20180610012510p:plain

15. 同意して連携するをクリックします。

f:id:kharuka2016:20180610012517p:plain

連携に成功するとLINE Notifyアカウントに[IFTTT]と連携が完了しました。通知先に設定したLINEグループにこのアカウントを招待して下さい。と通知がきます。通知先に設定するLINEグループにLINE Notifyアカウントを招待してあげましょう。

f:id:kharuka2016:20180610012550p:plain

16. Send messageをクリックします。

f:id:kharuka2016:20180610012521p:plain

17. Recipientで通知先に設定するLINEグループを選択します。

f:id:kharuka2016:20180610012525p:plain

18. Messageに注文を受け付けました。<br>ビール:{{NumberField}}杯<br>{{CreatedAt}}と入力し、Create actionをクリックします。

f:id:kharuka2016:20180610012529p:plain

19. Finishをクリックします。

f:id:kharuka2016:20180610012533p:plain

f:id:kharuka2016:20180610012539p:plain

20. Check nowをクリックします。

f:id:kharuka2016:20180610012543p:plain

f:id:kharuka2016:20180610012546p:plain

コレで開発は完了です。

Google Home Mini に「OK Google.」

緊張とワクワクの中「ビールを3杯下さい。」

、、、

、、、

、、、

。。。

???

???

???

むむむ

これは

もしや

キター!LINEに注文通知キター!!

チームメンバーみんな歓喜の雄叫び。ほんまは私だけ?

f:id:kharuka2016:20180610012553p:plain

▼記事の続きは以下へ。

ChatWork編(執筆中)

参考

*1:フットワーク軽い

gacco 「社会人のためのデータサイエンス入門」 Week 1 : 統計データの活用 part 3

データサイエンティスト養成読本 登竜門編

データサイエンティスト養成読本 登竜門編

▼gacco 「社会人のためのデータサイエンス入門」 Week 1 : 統計データの活用 part 2 はこちらです。

kharuka2016.hatenablog.com

1-7. スポーツをデータで科学する〜分析事例⑤

ワールドカップで勝つためには

ワールドカップ2010のデータから勝つための要因を考えてみよう FIFAから国別に得点、シュート数、位置別シュート数、攻撃、守備、反則、パス、走行距離などのデータが公表されている。

資料:FIFA国際サッカー連盟)ウェブサイトより 出典:総務省統計局『なるほど統計学園』

▼以下サイトからエクセルファイルをダウンロード出来ます。

因果関係を分析する(回帰分析)

何を説明したいのか(=被説明変数)

「ワールドカップで勝つためには」という分析の目的からすると、順位、勝率、勝ち数・・・などが考えられる。 ここでは、「勝率」を被説明変数とする。

目的変数とも言いますね。

勝つためには何をすればよいか(=説明変数)

公表されているたくさんのデータから、「勝率」に関係しそうな変数を見つけよう。

先程ダウンロードしてきたエクセルファイルの列から「勝率」に関係しそうな変数を探しましょうよ!と。

1-8. 合計特殊出生率の見方~分析事例⑥

我が国における少子高齢化の現状と展望

急激に進む日本の高齢

65歳以上を高齢者と定義し

総人口に対する高齢者人口割合のことを

高齢化率と呼びます。

WHO世界保険機関の基準では

この高齢化率が14%を超えると高齢化社会

21%を超えると超高齢化社会と定義しています。

日本の高齢化率は2017年の時点でなんと

27.7%!!

ドラゴンボールで言うところのスーパーサイヤ人2ですね。笑

少子化高齢社会

合計特殊出生率」とは?

ある年次の15歳から49歳までの女性の年齢別出生率を合計した数値

1人の女性が一生のうちに、仮にその年次の年齢別出生率で子どもを

生むと仮定した場合の子ども数に相当

人口が維持できる水準(人口置換水準)は2.07

単純に考えても夫婦2人が子供3人をつくらないと人口増加は望めないですよね。

1-9. 国際比較データから日本社会を読み解く~分析事例⑦

国際比較からみる日本社会の高齢社会

世界に先駆けて進む日本の高齢

日本は対高齢化社会へのビジネスを世界に先駆けて経験しているので

世界へ対高齢化社会ビジネスを展開して行きたいですね。

国際比較データでみる平均寿命(2015年)

Q.では国民の経済的な豊かさは寿命と対応している?

国民の経済的な豊かさを一人あたりGDPと定義すると、そうでもないみたいですね。

経済的な豊かさとは?そもそも豊かさとは?何か考えさせられますね。

▼記事の続きは以下へ。

(執筆中です。)

岩波データサイエンス Vol.1

岩波データサイエンス Vol.1

参考

gacco 「社会人のためのデータサイエンス入門」 Week 1 : 統計データの活用 part 2

データサイエンティスト養成読本 登竜門編

データサイエンティスト養成読本 登竜門編

▼gacco 「社会人のためのデータサイエンス入門」 Week 1 : 統計データの活用 part 1 はこちらです。

kharuka2016.hatenablog.com

1-4. M字カーブの改善効果~分析事例②

“M字カーブ”とは 日本の女性の労働力人口比率は結婚・出産期に当たる年代で一旦低下し、育児が落ち着いた時期に再び上昇する。これをM字カーブという。

スウェーデンの女性労働力人口比率と比較して、日本の女性は産後などで育児に専念する傾向にあるため、

スウェーデン並みに日本の女性労働力人口比率を上げて、少子高齢化社会に対する労働力を確保しましょうよ!と。

女性に限らず男性も育児に参加するご時世なので、国を支えるお金が足りないから、

産後の育休期間をなるべく減らして女性を働かせるのは如何なものか?

女性が働きやすい職場づくりをすることは大切なことだが、個々人のライフプランは国が決めることではない。

1-5. 普及率の地域間比較〜分析事例③

太陽光発電システムの普及率の地域間比較

住宅数で比較するのは正しい?

NO!

住宅総数が多い大都市圏で太陽光発電システムが普及しているように見える。

母集団が大きいので太陽光発電システムのある住宅数が多いのは合理的。

これでは正しい太陽光発電システムの普及率はわからない。

比率(普及率)で比較しよう

九州など日射量の多い地域で太陽光発電システムの普及率が高くなる傾向にあることが分かる。

陽が当たらないと太陽光発電出来ませんからね。

1-6. 付加価値額〜分析事例③

“付加価値額”とは 企業の生産活動等によって新たに生みだされる価値のこと 営業利益に給与総額と租税公課を加えたもの 一般的に人件費の高い産業で大きくなる傾向

産業間で付加価値額に差があるのはなぜ?

非正規職員比率が関係していそうだ。

他にも産業として価格競争が起きやすい、近年の飛躍的な技術の発展の波に乗れているか?なども関係していそうだ。

付加価値額と非正規職員比率には関連性がある?

負の相関関係がありそうですね。

非正規職員は労働時間が短く給与が低いため、非正規職員比率が高い産業は付加価値が小さくなる

日本郵政グループが正規社員と非正規社員の「同一労働同一賃金を目指し、

待遇格差をなくすために正規社員の住宅手当などを削減していくというニュースがありましたよね。

待遇格差のなくし方については様々な意見があると思いますが、

正規社員にとってはたまったもんじゃないですね。笑

相関係数

相関係数(そうかんけいすう、英: correlation coefficient)は、2つの確率変数の間にある線形な関係の強弱を測る指標である[1][2]。相関係数は無次元量で、−1以上1以下の実数に値をとる。相関係数が正のとき確率変数には正の相関が、負のとき確率変数には負の相関があるという。また相関係数が0のとき確率変数は無相関であるという[3][4] 。

▼記事の続きは以下へ。

kharuka2016.hatenablog.com

岩波データサイエンス Vol.1

岩波データサイエンス Vol.1

参考

gacco 「社会人のためのデータサイエンス入門」 Week 1 : 統計データの活用 part 1

データサイエンティスト養成読本 登竜門編

データサイエンティスト養成読本 登竜門編

1-1. 大人がデータサイエンスを学ぶべき理由

経験、勘やロジカルシンキングより正しい意思決定をするためにデータ分析を行います。

データ分析をうまく使って、企業であれば企業競争力、個人であればキャリア形成に役立てましょう。

但し、情報洪水に溺れ意思決定が遅くなることは避けましょう。

▼詳しくは以下の仮説思考を一読頂きたいです。

kharuka2016.hatenablog.com

1-2. データサイエンスと統計

データサイエンスとは

データの分析についての学問。統計学、数学、計算機科学などと関連し、主に大量のデータから、何らかの意味のある情報、法則、関連性などを導き出すこと、または、大量のデータの処理の手法に関する研究を行う。(デジタル大辞泉より)

データサイエンティストとは

データサイエンスの研究者、実践者、技術者。更に進んで、データサイエンスを身に付け、統計を始めとするデータに基づく合理的な思考により課題を解決できる人を指すことも。

データサイエンティストを目指すには

「データ」の代表的なものは統計情報。 データサイエンティストを目指すのであれば、統計(学)に関する知識は必須。

データサイエンティストを目指すには統計学をしっかり学ばなければいけないそうだ。

算数、数学が苦手なんて言ってられないですね。笑

PPDACサイクル

データサイエンスの世界ではPDCAサイクルみたいなサイクルがあるそうな。

Probelm 問題の発見
Plan 調査の計画
Data データの収集
Analysis 分析
Conclusion 結論

1-3. 平均値の見方〜分析事例①

平均値

平均(へいきん、英: mean, 独: Mittelwert, 仏: moyenne)または平均値(へいきんち、mean value)は、観測値の総和を観測値の個数で割ったものである[1]。 例えば A、B、C という3人の体重がそれぞれ 55 kg、60 kg、80 kg であったとすると、3人の体重の平均値は (55 kg + 60 kg + 80 kg)/3 = 65 kg である。 特に断らずに平均という場合の多くはこのような加算して個数で割ったものである。

中央値

中央値(ちゅうおうち、英: median)とは、代表値の一つで、有限個のデータを小さい順に並べたとき中央に位置する値。たとえば5人の人がいるとき、その5人の年齢の中央値は3番目に年寄りな人の年齢である。ただし、データが偶数個の場合は、中央に近い2つの値の算術平均をとる。中央値の事を、メディアン、メジアン、中間値とも呼ぶ。ただし、「中間値の定理」の中間値はこの意味ではない。

最頻値

統計学における最頻値(さいひんち)またはモード(英: mode)とは、データ群や確率分布で最も頻繁に出現する値である[1]。日本工業規格では、「離散分布の場合は確率関数が,連続分布の場合は密度関数が,最大となる確率変数の値。分布が多峰性の場合は,それぞれの極大値を与える確率変数の値[2]。」と定義している。 平均や中央値と同様、最頻値は確率変数または何らかの単一の量についての母集団に関しての重要な情報を得る手段の一つである[3][4]。最頻値は一般に平均や中央値とは異なり、特に歪度の大きい分布では大きく異なることがある。 最も頻繁に出現する値は1つとは限らないため、最頻値は一意に定まらないことがある。特に一様分布ではどの値も同じ確率で出現するため、最頻値が定まらない。

分布が標準正規分布になる場合は平均値(=中央値=最頻値)、分布に偏りがある場合は外れ値の影響を受けにくい中央値でデータの分布を判断した方が適切です。

平均年収ではなく中央値年収の方が庶民の肌感覚にあう?笑

▼記事の続きは以下へ。

gacco 「社会人のためのデータサイエンス入門」 Week 1 : 統計データの活用 part 2(執筆中です。)

岩波データサイエンス Vol.1

岩波データサイエンス Vol.1

参考