次元の海で溺れる

Rとデータ解析と統計手法たちとわたし

Rに関する主成分分析とSappoRo.Rのはなし

あと30分で月曜日がやってきてしまう。。

現実逃避がてら久々に最近ためになったSlideshareのはなし。

主成分分析


話の内容が、というより何よりも
スライドの作り方が非常に勉強になりました。

Rだったり機械学習だったり統計だったり
そこらへんのスライドは、たとえ

「データの可視化」の有用性をうたっていても
微妙に見栄えが悪かったり、

もちろんこのくらいはわかるよね・・・?
ってな具合の高尚な書かれ方をされていたり、

はたまた

あんまりにもやさしく書いて頂いていて
理論的根拠や数式や、実装イメージの無いものであったり

人に伝えるのって大変だよなあ。。って思わせてくることが多いんですが、

これは見せ方も理論的背景も実際の分析イメージもつきやすくて
わくわくしました。


主成分分析の話をすると、

次元をうまいこと圧縮したにも関わらず
他の分析手法に比べて解釈を主観に委ねる割合が高くない?

みたいな議論を半年前くらいにした記憶があるんですが、
このスライドでもそれに近いことがちらっと述べられていました。

主成分分析だけでデータに対するオチをつけるのは
かなりの技術力、というか語彙力を求められるよなあ、、という苦手意識があります。
いまのところ。


はてなブログだとこちらの記事も。

statsbeginner.hatenablog.com


私もこのくらい分かりやすい構成で話がしたい。
そして毎度のことながら金 明哲先生は本当にすごい。

SappoRo.Rのはなし

勇気を出して今年こそSappoRo.Rの参加を決めました。

ggplot2の話があるみたいなので

予習がてら一本テーマ決めてスライド作品作りでもしようかと思っていたものの
間に合いそうにないなあ、、、


身長体重データとか男女出生比率らへんでならなんか作れるかな。
やりかけたまま放置のコロプレスマップもあったりするけど、、、


聖書である高村本もしばらく読めてないし、
仕事を言い訳にしてグダグダしたらだめですね。


次は何をしようかなあ