次元の海で溺れる

Rとデータ解析と統計手法たちとわたし

「パターン認識と機械学習入門」という神のスライドについて

このスライドと出会ったのは論文に煮詰まっていた時のことです。
世はクリスマスイブとかいう聖夜のことでした。

64個からの変数選択と凶悪なマルチコ処理に追われて、何かを見失い、
ロジット・・・線形判別・・・あとなんだ、SVMか・・・?
そもそも機械学習ってなんだっけ?とか根本的な事を言い出した21時。

出会ったスライドがこれ。

Hayamizu momokoさんのslideshareです。

読み終わってちょっと泣いた。ほんとに。

やれることがどんどん増えたら、いいことばかりあるような気がしていて、
気づいたら何も捨てられなくなって、情報に溺れて、
白鳥とあひるの違いすら分からなくなって、

「そもそも白鳥とあひるって何が違うの???」

的なことを言い出していたクリスマスの私は

やっと目が覚めて、
Rをやり始めた時の気持ちを少し思い出して
ちょっと泣いて、
速攻で帰って、速攻で寝た。

がむしゃらに突き進んでたらいつか幸せの青い鳥が見つかって
そうしたら自分の選択を自分で認めてあげられるかもしれないみたいな
そんなスタバのなんちゃらフラペチーノみたいな甘い妄想を
私は当時のモデルにぶちこんでいて。

でも自分の選択した道が正しいかどうかなんて

「結局主観的確率じゃない?」

って言われたら

「ですよね」

ってならざるをえないわけです

そもそも自らの生きざまモデル製作に賭けるみたいな
そんな身の削り方はどうなのよ!
あほか!!!

と今なら笑い話にもなります。が、そのぐらい当時の私には
のっぴきならない事態でした。

セイキブンプ?なんのこと?
だった4年前にもせんせいはおっしゃっていたじゃないか、

「真のモデルは求められないから迂回して近似させて
推定するんだよ」

って。

今でも人生とは、、はて?
ってなった時はこのスライドを読みます。

んでもって

私がデータ解析やらRやら統計やらを趣味として細々続けているのは

社会貢献が!とか
技術的革新が!とか
データの持つ無限の可能性が!とか

そんな高尚なことではちっともなくって

「本当のことなんて誰にもわかんねぇよって思えるから
少し気が楽になる」

とかいうあまりにも唯我独尊な目的によるものです。