次元の海で溺れる

Rとデータ解析と統計手法たちとわたし

はてなブログでTex数式を書いてみる話(1)~自然言語処理シリーズ「言語処理のための機械学習入門」より~

WAF@失踪中です。

特に誰にも何も告げずに札幌を飛び出して数日が経ちました。
家出です。探さないでください。

「自分から逃げたい超逃げたいおなかいっぱい食べて寝たい!!!!」

こんなこと言ってる失踪中の身分にも関わらず
最新の論文が何かしら受賞したようでありがたかったです。
恐縮しきりです。
いいのかな。。貰っても。。


そんなこんなで家出中はいつものR環境も形態素解析環境も使えないので
バイブルの勉強をちまちまと。

聖書

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

My聖書こと、高村本です。

数式がとても丁寧でわかり易くて
頭が上がらない、ひれ伏してる。

おかげでめんどくさそうな数式が
怖くなくなりました!!(20代女性)

勉強したのをささっとまとめたい。しかし。

手書きの勉強ノート3冊を手に、はたと気が付いた。
私はLaTexに対してあまりにも無知であると。

だからいちいち手書きで数式を書き、
手書きで証明をし、
必要に迫られた時はofficeとかの数式エディタで
難を逃れてきたのだ。

論文製作でどれほど苦労したか思い出したくもない、、、

ということで、
バイブル読みながら今更ながらのLaTexデビューをします。

そもそもTexとかLaTexってなんぞや。

TeX入門 - TeX Wiki

元々文書を美しく効率的に記述するためのもの。
なので、数式みたい特殊な記述のオンパレードも効率良く記述出来るんですね。
数式書きまくる人には必須スキルというか出来て当たり前、と良く聞きます。

あたりまえ、、?(はて)

とりあえず自分に関しては、論文製作が佳境の頃

「うちらさ、、テフでやればよかったなんて言わないようにしようね」

と約束し合った友(計量経済専攻)が居るので過去は振り返りません。

はてなブログで出来るらしい

LaTex当時なんでやらなかったかって、
「だって環境構築めんどくさかったんだもん」
の一言に尽きます。

でもやってみたいなーということで。
こちらのサイトさんにちょいちょいコマンドを打ち込んで出力してみました。

TeX を使ってみよう

た、たのしい、、、

目的は統計関連の式をブログに適宜登場させる、というところなので
こちらのブログ様にお世話になりました。


はてなブログで数式を表示する方法。または、tex記法でLaTexを記述する方法。 - Pythonでも金融工学でもない。

聖書こと高村本のナイーブベイズ分類器周辺について、
LaTex方式で書いてみます。

実際にTex記法しながらナイーブベイズ分類器

・ナイーブベイズ分類器は確率に基づいた分類器
・事例dに対してP(c|d)がmaxとなるクラスcを出力する。

ベイズの定理
{ \displaystyle
P(c|d)=\frac{P(c)P(d|c)}{P(d)}
}

ベイズの定理における右辺が最大となるクラスcを出力するのが目的。
・しかし、P(d)はクラスcに依存しない。=文書dにのみ依存する

{ \displaystyle
c_{max}=arg max_c P(c)P(d|c)
}

上記により求めることが可能。
このP(d|c)の導出方法として、2種類いずれかのモデルが仮定される。

①多変量ベルヌーイモデル
②多項モデル

つまるところ、
P(d|c)に①②いずれかのモデルを仮定し、P(c)P(d|c)を最大化する
cの導出を行うのがナイーブベイズ分類器ってこって、、

はてなでのTex記法

唐突なナイーブベイズ。笑

[tex:{\displaystyle
数式
}]

みたいな感じで今回は書きました。
これでいつでも数式書けるようになるかなあ、、、