===== 確率論 =====
==== 授業計画 ====
^回^テーマ^トピック^予定日^実施日^レポート課題^
|#01|ガイダンス、確率の基礎概念(1)|事象,確率|2011.04.07| | |
|#02|確率の基礎概念(2)|事象,確率|2011.04.14| | |
|#03|確率の基礎概念(3)|条件つき確率と独立性,ベイズの定理|2011.04.21| | |
|#04|確率変数と分布関数(1)|確率変数,確率分布,分布関数|2011.04.28| |2011.05.11〆切で出題(第1章分)|
|#05|確率変数と分布関数(2)|確率変数のモーメント,分散|2011.05.12| | |
|#06|モーメント母関数とその応用(1),離散型確率モデル(1)|モーメント母艦数,ベルヌーイ分布,二項分布 |2011.05.19| | |
|#07|離散型確率モデル(2),連続型確率モデル(1)|幾何分布,負の二項分布,ポアソン分布,指数分布|2011.05.26| |2011.06.01〆切で出題予定(第2章分)|
|#08|連続型確率モデル(1)|ポアソン分布と指数分布の関係,正規分布|2011.06.02|2011.06.23| |
|#09|中間試験および解説| | | | |
|#09|確率ベクトルと分布関数(1)|確率ベクトル,同時分布,周辺分布|2011.06.09|2011.06.23, 2011.06.30| |
|#10|確率ベクトルと分布関数(2)|確率変数の独立性,同時モーメント,共分散,相関係数|2011.06.16|2011.06.30, 2011.07.07|2011.06.22〆切で出題予定(第5,6章分)|
|#11|モーメント母関数とその応用(2)| |2011.06.23| | |
|#12|連続型確率モデル(3)|2変量正規分布|2011.06.30|2011.07.07| |
|#13|大数の法則| |2011.07.07|2011.07.14|2011.07.14〆切で出題予定(第3章分)|
|#14|中心極限定理| |2011.07.14| | |
|#15|標本分布論| |2011.07.21|パス| |
|#16|期末試験| |試験期間中| | |
==== #1 2011.04.07 ====
* 確率論を文法として使う分野・領域
* 事象、空間、集合
==== #2 2011.04.14 ====
* 確率
* 確率空間は形だけ
* 条件付き確率
==== #3 2011.04.21 ====
* 条件付き確率 {\rm Pr}\left[A|B\right]=\frac{{\rm Pr}\left[A {\&} B\right]}{{\rm Pr}\left[B\right]}
* 独立性 {\rm Pr}\left[A {\&} B\right]={\rm Pr}\left[A\right]{\rm Pr}\left[B\right]
* ベイズの定理
* 確率変数
* 離散と連続
==== #4 2011.04.28 ====
[[http://stat.inf.uec.ac.jp/library/prob.2011/prob-4-note-and-quiz-20110428.pdf|課題 #1]]とその[[http://stat.inf.uec.ac.jp/library/prob.2011/prob-4-solutions-20110627.pdf|略解]]。
* 確率変数 X
* 確率分布 X\sim F
* 累積分布関数 F\left(x\right)={\rm Pr}\left[X\leq x\right]
* 確率関数 p\left(x\right)=F\left(x\right)-F\left(x-1\right)
* 確率密度関数 f\left(x\right)=\frac{d}{dx}F\left(x\right)
* スティルチェス積分 E_X\left[g\left(X\right)\right] = \int_{\Omega} g\left(x\right)dF\left(x\right)(いちおし!)
==== #5 2011.05.12 ====
* 密度関数と確率関数
* 要約統計量
* 平均
* 分散
* モーメント
* 線形変換の平均と分散
==== #6 2011.05.19 ====
* ラプラス変換
* モーメント母関数
==== #7 2011.05.26 ====
[[http://stat.inf.uec.ac.jp/library/prob.2011/prob-7-note-and-quiz-20110527.pdf|課題#2(2011.05.27版)]]
* ベルヌーイ分布
* 二項分布
木曜日に配布した[[http://stat.inf.uec.ac.jp/library/prob.2011/prob-7-note-and-quiz-20110526.pdf|課題#2のプリント(2011.05.26版)]]の#2-1に、全確率が1にならないタイプミスがありました。
正しくは
Pr\left[X=0\right]=0.1, Pr\left[X=1\right]=0.5, Pr\left[X=2\right]=0.4
です。この訂正、土曜日以降、掲示もします。ご免なさい。
==== #8 ====
==== #9 ====
==== #10 ====
[[http://stat.inf.uec.ac.jp/library/prob.2011/prob-a-note-and-quiz-20110616.pdf|課題#3]]
==== #11 ====
[[http://stat.inf.uec.ac.jp/library/prob.2011/prob-a-solutions-20110623-draft.pdf|課題#3の解答・手書き版]] (昨日、別の仕事のトラブル対応に追われて、タイプが間に合いませんでした。これからタイプに回しますが、とりあえず手書きのノートを暫定公開します。)
[[http://stat.inf.uec.ac.jp/library/prob.2011/prob-a-solutions-20110629.pdf|課題#3の解答・暫定公開版]] (タイプは終わりましたが、未推敲のため、タイプミスがありそうな気がします。)
* 2次元連続確率変数の
* 同時累積分布関数と同時密度関数
* 周辺累積分布関数と周辺密度関数
* 条件付き累積分布関数と条件付き密度関数
[[http://stat.inf.uec.ac.jp/library/prob.2011/prob-b-note-20110623.pdf|グラフ]]
B1 := plot3d(exp(-(1/2)*x^2)/sqrt(2*Pi)*(exp(-(1/2)*y^2)/sqrt(2*Pi)), x = -3 .. 3, y = -3 .. 3, axes = boxed);
B2 := plots[pointplot3d]({seq([3, (1/100)*y, exp(-(1/2)*((1/100)*y)^2)/sqrt(2*Pi)], y = -300 .. 300)});
B3 := plots[pointplot3d]({seq([(1/100)*x, 3, exp(-(1/2)*((1/100)*x)^2)/sqrt(2*Pi)], x = -300 .. 300)});
A1 := plot(eval(exp(-(1/2)*x^2)/sqrt(2*Pi)*(exp(-(1/2)*y^2)/sqrt(2*Pi)), x = -3), y = -3 .. 3, axes = boxed);
A2 := plot(eval(exp(-(1/2)*x^2)/sqrt(2*Pi)*(exp(-(1/2)*y^2)/sqrt(2*Pi)), x = -2), y = -3 .. 3, axes = boxed);
A3 := plot(eval(exp(-(1/2)*x^2)/sqrt(2*Pi)*(exp(-(1/2)*y^2)/sqrt(2*Pi)), x = -1), y = -3 .. 3, axes = boxed);
A4 := plot(eval(exp(-(1/2)*x^2)/sqrt(2*Pi)*(exp(-(1/2)*y^2)/sqrt(2*Pi)), x = 0), y = -3 .. 3, axes = boxed);
plots[display]({B1, B2, B3});
plots[display]({A1, A2, A3, A4})
library(mvtnorm)
postscript("prob-b-correlated-bivariate-normal-distribution-scatterplots-positive.eps", width=6, height=6)
par(mfrow=c(2,2))
par(cex=0.5)
plot(rmvnorm(n=3000, mean=c(0,0), sigma=matrix(c(1,0,0,1),ncol=2)),pch=20,
main ="Correlation Coefficient: 0", xlab="X.1", ylab="X.2")
plot(rmvnorm(n=3000, mean=c(0,0), sigma=matrix(c(1,0.5,0.5,1),ncol=2)),pch=20,
main ="Correlation Coefficient: 0.5", xlab="X.1", ylab="X.2")
plot(rmvnorm(n=3000, mean=c(0,0), sigma=matrix(c(1,0.8,0.8,1),ncol=2)),pch=20,
main ="Correlation Coefficient: 0.8", xlab="X.1", ylab="X.2")
plot(rmvnorm(n=3000, mean=c(0,0), sigma=matrix(c(1,0.95,0.95,1),ncol=2)),pch=20,
main ="Correlation Coefficient: 0.95", xlab="X.1", ylab="X.2")
postscript("prob-b-correlated-bivariate-normal-distribution-scatterplots-negative.eps", width=6, height=6)
par(mfrow=c(2,2))
par(cex=0.5)
plot(rmvnorm(n=3000, mean=c(0,0), sigma=matrix(c(1,0,0,1),ncol=2)),pch=20,
main ="Correlation Coefficient: 0", xlab="X.1", ylab="X.2")
plot(rmvnorm(n=3000, mean=c(0,0), sigma=matrix(c(1,-0.5,-0.5,1),ncol=2)),pch=20,
main ="Correlation Coefficient: -0.5", xlab="X.1", ylab="X.2")
plot(rmvnorm(n=3000, mean=c(0,0), sigma=matrix(c(1,-0.8,-0.8,1),ncol=2)),pch=20,
main ="Correlation Coefficient: -0.8", xlab="X.1", ylab="X.2")
plot(rmvnorm(n=3000, mean=c(0,0), sigma=matrix(c(1,-0.95,-0.95,1),ncol=2)),pch=20,
main ="Correlation Coefficient: -0.95", xlab="X.1", ylab="X.2")
graphics.off()
==== #12 ====
* 同時分布と条件付き分布と周辺分布の関係
* 期待値ベクトル
* 分散共分散行列
==== #13 ====
* 二変量正規分布
* 期待値ベクトル
* 分散共分散行列
* 相関係数
* 条件付き分布
* 周辺分布
==== #14 2011.07.14 ====
[[http://stat.inf.uec.ac.jp/library/prob.2011/prob-e-note-and-quiz-20110714.pdf|課題4]] ([[http://stat.inf.uec.ac.jp/library/prob.2011/prob-e-solutions-20110802.pdf|解答例]] (手書きの汚いノートで済みません。レポートを8/2と8/3の二日間は、西5号館3階の事務室で返却しています。8/4には試験会場に持って行くので、事務室からは引き上げます。), [[http://stat.inf.uec.ac.jp/library/prob.2011/prob-e-solutions-20110802-last-page.pdf|解答例の最後のページ]] (スキャンミスしました。重ね重ね済みません。))
* マルコフの不等式
* チェビシェフの不等式
* 大数の法則
参考書
* 宮川雅巳(1998)「統計技法」, 共立出版.
=== 課題4への補足 ===
== 離散分布の共分散と相関係数 ==
\left(X_1, X_2\right)が有限個の値の組み合わせしかとらない場合、それぞれの値の組み合わせをとる確率を p\left(x_1, x_2\right) と置くと、
E\left[X_1\right] = \sum_{x_1} \sum_{x_2} x_1 p\left(x_1, x_2\right) = \sum_{x_1} x_1 \sum_{x_2} p\left(x_1, x_2\right) = \sum_{x_1} x_1 p_1\left(x_1\right)
と
E\left[X_2\right] = \sum_{x_1} \sum_{x_2} x_2 p\left(x_1, x_2\right) = \sum_{x_2} x_2 \sum_{x_1} p\left(x_1, x_2\right) = \sum_{x_2} x_2 p_2\left(x_2\right)
と
E\left[X_1X_2\right] = \sum_{x_1} \sum_{x_2} x_1 x_2 p\left(x_1, x_2\right)
から、今回の参考書からの出題で証明させられる
Cov\left[X_1, X_2\right] = E\left[X_1X_2\right]-E\left[X_1\right] E\left[X_2\right]
から共分散を求めることができる。
相関係数を計算するにも、
E\left[X_1^2\right] = \sum_{x_1} \sum_{x_2} x_1^2 p\left(x_1, x_2\right) = \sum_{x_1} x_1^2 \sum_{x_2} p\left(x_1, x_2\right) = \sum_{x_1} x_1^2 p_1\left(x_1\right)
と
E\left[X_2^2\right] = \sum_{x_1} \sum_{x_2} x_2^2 p\left(x_1, x_2\right) = \sum_{x_2} x_2^2 \sum_{x_1} p\left(x_1, x_2\right) = \sum_{x_2} x_2^2 p_2\left(x_2\right)
を用いて、周辺分散を
V\left[X_1\right] = E\left[X_1^2\right]-\left\{E\left[X_1\right]\right\}^2
と
V\left[X_2\right] = E\left[X_2^2\right]-\left\{E\left[X_2\right]\right\}^2
のように求め、これらと先に求めた共分散とを合わせて、
\rho\left[X_1, X_2\right] = \frac{Cov\left[X_1, X_2\right]}{\sqrt{V\left[X_1\right]V\left[X_2\right]}}
を得る。この手順が一番、計算間違いしにくいんじゃないかと思う。
== 条件付き期待値 ==
定数としての条件付き期待値と確率変数としての条件付き期待値の区別。\left(X_1, X_2\right)\sim F\left(x_1, x_2\right) とする。
X_2の定義域を\Omega_2と置くと、
E\left[\phi\left(X_2\right)|X_1=x_1\right]=E_{X_2|X_1}\left[\phi\left(X_2\right)|X_1=x_1\right]=\int_{x_2\in\Omega_2} \phi\left(v\right)dF_{X_2|X_1}\left(v|x_1\right)
最後の積分は、連続分布の場合には、
\int_{x_2\in\Omega_2} \phi\left(v\right)f_{X_2|X_1}\left(v|x_1\right)dv = \int_{x_2\in\Omega_2} \phi\left(v\right) \frac{f_{X_1,X_2}\left(x_1, v\right)}{f_{X_1}\left(x_1\right)}dv
と書ける。離散分布の場合にも同様に、総和記号と条件付き確率の公式(あるいはベイズの定理)を用いて、表せる。いずれにせよ、右辺に大文字は残らないので、これは定数。これを
\mu_\phi\left(x_1\right)=E\left[\phi\left(X_2\right)|X_1=x_1\right]
と置く。
次に、
E\left[\phi\left(X_2\right)|X_1\right]
の方だが、手続きとしてはまず、上のX_1=x_1を与えた条件付き期待値を計算してから、改めて、x_1を確率変数X_1で置き換えることになる。
これはすなわち、\mu_\phi\left(x_1\right)のx_1を確率変数とみなせ、という意味で、\mu_\phi\left(X_1\right) を考えよ、ということだから、これは確率変数 X_1 の関数なので、確率変数。
==== #15 2011.07.21 ====
* 中心極限定理
* レポート一斉返却
参考書:
* 清水良一(1976)「中心極限定理」, 教育出版.
* 竹内啓(1975)「確率分布の近似」, 教育出版.
* 竹内啓(1974)「統計的推定の漸近理論」, 教育出版.
* D. Williams(1991, 赤堀・原・山田・訳, 2004)「マルチンゲールによる確率論」, 培風館.
==== #16 2011.07.28 ====
16回目なので休講。
期末試験が16週目になる。
==== #Exam 2011.08.04 ====
期末試験: [[http://stat.inf.uec.ac.jp/library/prob.2011/prob-f-final-exam-20110804.pdf|期末試験問題]], ([[http://stat.inf.uec.ac.jp/library/prob.2011/prob-f-solutions-20110805.pdf|採点用解答例(手書き)]])
|日時|2011.08.04 0240pm-0410pm|
|場所|C-301|
ルール
* 通信機能を持たない電卓の持ち込みは可とする
* 出席をとるので学生証を持参のこと
* 退室の願い出は、試験開始の30分後から許可する
お願いごと
* 回答用紙は、可能な限り1ページ単位で使用してほしい
=== 試験略解 ===
== 問1: ポアソン分布づくし ==
今年はポアソン分布を使って、モーメントの計算、モーメント母関数、和の分布、中心極限定理について、尋ねてみました。
- 平均も分散も\lambdaなポアソン分布のモーメント母関数は、講義ノートにもある通りe^{\lambda}exp\left(\lambda e^t\right)
- 3次のモーメントはモーメント母関数のテイラー展開の3次の項の係数
- \lambdaが大きくなるにつれて、密度関数が対称に近づくことが、\beta_1\rightarrow 0 (\lambda\rightarrow\infty)から確認できる
- ポアソン分布に互いに独立に従う確率変数の和の分布はポアソン分布に従うことも、モーメント母関数の積から確認できる
- ポアソン分布に互いに独立に従う確率変数の和をnで割ると、「平均」になる。それで中心極限定理の出番。
== 問2: 離散分布 ==
条件付き確率に関する計算と、共分散や相関係数の計算を定式化できるかどうかを、離散分布を用いて尋ねてみました。一番、計算間違いをしにくい計算手順は、たぶん次の通り。
- 3×5の確率表ですが、条件をつけると3×3に減り、レポート課題と同じ程度の計算量になる。しかも、\left|X-Y\right|\leq 1となる確率は、頑張って0.8にしてみた。
- 条件付き期待値を \mu_{1,x} = \frac{5}{4}\sum_{\left|x-y\right|\leq 1} x p\left(x,y\right), \mu_{1,y} = \frac{5}{4}\sum_{\left|x-y\right|\leq 1} y p\left(x,y\right) などと、確率を掛けたものを足してから、あとで5/4をかける(=0.8で割る)
- 条件付きの二乗の期待値や積の期待値も同様に \mu_{1,x}= \frac{5}{4}\sum_{\left|x-y\right|\leq 1} x^2 p\left(x,y\right), \mu_{2,y} = \frac{5}{4}\sum_{\left|x-y\right|\leq 1} y^2 p\left(x,y\right), \mu_{2,xy} = \frac{5}{4}\sum_{\left|x-y\right|\leq 1} xy p\left(x,y\right), などと、確率を掛けたものを足してから、あとで5/4をかける(=0.8で割る)
- 条件付き共分散が \mu_{2,xy}-\mu_{1,x}\mu_{1,y} であることは、第4回のレポート課題から。
- 条件付き分散が \mu_{2,x}-\mu_{1,x}^2 と \mu_{2,y}-\mu_{1,y}^2 であることは、問1の(2)式から。
確率の値、和や積分の範囲は変わるけど、期待値やモーメントの計算手順には、条件付きも条件なしも無いので。
== 問3: 二変量正規分布 ==
二変量正規分布の周辺分布を得るのは、ベイズの定理などから
f\left(x_1, x_2\right)=f_{2|1}\left(x_2|x_1\right)f_1\left(x_1\right)
との分解を得れば良い。f_{2|1}\left(x_2|x_1\right)がx_2についての密度関数になっていて、f_{1}\left(x_1\right)がx_1についての密度関数になっているように、分解すれば良く、密度関数であることはその関数が非負かつ全積分が1になることで確認できる。もっと言うと、この問題の場合には、正規分布の密度関数であることを確認できれば十分。
- 周辺分布の密度関数は N\left(\mu_1, \sigma^2\right) のそれであれば良いので、そのように括り出せば良い。
- 条件付き分布の密度関数は、同時密度関数を周辺密度関数で割る、ベイズの定理をそのまま使えば良い。
== 問4: ギリシャ文字 ==
1、2個間違えたぐらいで、大きく減点する気はありませんが、5,6個以上になると、予告してあった問題なのでさすがに。
==== 連絡 ====
* 欠席などで受け取っていない課題レポートを回収したい人は、来週の月曜日以降、西五号館6階のエレベータを降りたところに、置いておきますので、各自でどうぞ。不要でしたら、こちらで処分しておきます。(2011.08.05 01:40pm)
* 期末試験は、採点用の詳解の例を作り終えたところで、まだ採点を始めていません。(2011.08.05 01:40pm)