データの転がる音がする

気が向いたら取り組んだことをまとめて記事にしたいと思います。機械学習やソフトウェアの話、はたまた読んだ本についてなど、内容は気が向くままにです。

PyMCでベイズ統計を駆使できるようになる(1)

ベイズ統計って強力ですよね。この枠組みを知っていたら頻度主義的な点推定とか、なんだか古典的に感じてしまうような、頼りになる雰囲気を持っています。Thomas Bayesが18世紀前半の人なのでその歴史は300年近くになりますが、計算資源が豊富になった今、この武器はアカデミア、ビジネスを問わず広く使われるようになりました。

私もこの武器を身につけるべく、PRMLやMurphyを読んで勉強してきたつもりでした。しかし、機械学習の教科書に出てくるのは方程式ばかり。ベイズを使った現実のデータ解析ができるという感触は持てませんでした。おそらく、その理由は次の3つです。

  1. 例題として扱う現実的なデータが取得しづらい

  2. データを説明する実践的な統計モデリングをどのように設計したら良いのかわからない

  3. 解析的に解けないモデルを計算機の力でどのように解決するか示されていない 

こういった問題を解決したのが久保先生の「データ解析のための統計モデリング入門」だと考えられます。しかし、

  「Pythonで解析したい!それも、もっと現実のデータに対して、

            自由な統計モデリングとやらをたくさん適用してみたい!」

という自分の内なる声を感じたので、この機会に色々と勉強してみました。

 

武器としての生成モデルの3表現

神嶌さんのPyMCがあれば,ベイズ推定でもう泣いたりなんかしない が非常に参考になりました。ベイズで解析をする際、生成モデルを記述することが必要となりますが、「生成モデルを説明するには3つの表現方法がある」と考えるとすっきりするようです!

  1. 仮想コードによる表現

  2. グラフィカルモデル表現

       3. 数式による表現

教科書ではどれか1つの表現で記述されていることが多いのですが、それらを自由に行き来できるようになること自由な統計モデリングをするために必須のスキルと思われます。

f:id:idkphys-030zzz:20160812055248j:plain

記事を書くのにまだ慣れてないので、今日はここまで!

 

ブログをスタート

みなさまはじめまして。 

これまではひっそりと、勉強したことをまとめるためにブログを書いていたのですが、大学の友達に誘われてブログを公開することにしました。そのため古い記事はこれまで書きためていた内容を改変したものとなっています。

どうぞ宜しくお願いします。

 

f:id:idkphys-030zzz:20160812040948j:plain