差分

このページの2つのバージョン間の差分を表示します。

--- dm:2011 [2011/08/01 13:35] – [テスト用コード] created watalu
+++ dm:2011 [2011/08/02 10:28] – [補足] watalu
@@ 行 282: / 行 282: @@
 ==== 演習2 ====
+=== 日程 ===
+|出題|2011.07.21|
+|〆切|2011.08.04|
 === 今回の解析の流れ ===
@@ 行 361: / 行 366: @@
 今回は二つのパッケージを用いるので、インストールしておく。
 <code>
+install.packages(pkgs=c("gam"),
+                 repos='http://cran.md.tsukuba.ac.jp/',
+                 dependencies=TRUE)
 library(gam)
 </code>
@@ 行 550: / 行 558: @@
 以下で、モデルを大幅に変更すると、初期値の探索もしなければならなくなるので、気をつけられたし。
+=== モデルを当てはめる ===
+  * このデータの場合、データ観測系列は1本なので、ロバストな推定方法は使わない。
+  * 先週の説明の通り、飽和しかけているので、曲線を強度関数に用いる (累積データに「飽和する曲線」を当てはめる場合、変曲点後まで観測できているか否かで、当てはまりがとても異なるので注意)
+データの先頭に1行、0を入れておく。
+<code>
+software.debugging.diff <- rbind(c(0,0,0,0,0,0),software.debugging.diff)
+</code>
+強度関数は，次の通り。
+<code>
+lambda.t <- function(theta, alpha, beta, j, data) {
+  diff.1 <- (exp(-theta*data$t[j-1])-exp(-theta*data$t[j]))
+  diff.2 <- (alpha+beta*sum(data$Ct.diff[1:(j-1)]*exp(theta*data$t[1:(j-1)])))
+  return(diff.1*diff.2)
+}
+#lambda.t(0.001704,19.1745,0.003045,10,software.debugging.diff)
+</code>
+これを用いた対数尤度関数を、次のように定義する。
+<code>
+neg.log.lik <- function(x) {
+  theta <- x[1]
+  alpha <- x[2]
+  beta  <- x[3]
+  J <- dim(software.debugging.diff)[1]
+  log.lik.temp <- 0
+  for( j in c(2:J) ) {
+    lambda.j <- lambda.t(theta,alpha,beta,j, software.debugging.diff)
+    log.lik.temp <- log.lik.temp - lambda.j
+    log.lik.temp <- log.lik.temp + software.debugging.diff$Nt.diff[j]*log(lambda.j)
+  }
+  return(-log.lik.temp)
+}
+</code>
+対数尤度の最大化は、上の関数の最小化と等しい。
+Rには最小化の関数が幾つかある。nlminb(), optim(), nlm()など。
+これを最小化するのは、結構、困難であるが、例えば初期値を
+<code>
+fitted <- optim(c(0.001, 19, 0.005), neg.log.lik)
+print(fitted)
+</code>
+のように与えると、それなりの値に収束する。optim()の最初の引数は、最適化の初期値である。これは Cook and Lawless (2007)掲載の推定値を参考に設定した。
+以下で、モデルを大幅に変更すると、初期値の探索もしなければならなくなるので、気をつけられたし。
+== 補足 ==
+optimという関数は、目的関数と初期値を与えると最適化してくれる関数、で、幾つかの有名な最適化アルゴリズムを利用できて便利なのですが、探索範囲を制限することができない。
+今回の演習で用いているのはNelder-Meed法という、Simplex法に似たアルゴリズムで、初期値から出発して、探索していきます。その際に、大きな歩幅で探索すると、warningが表示されるように計算きない点に到達する。そのため、今回のような「計算可能な探索範囲」が狭い最適化問題では、目的関数を評価できない旨のwarningが沢山、ログに残る。ただし、初期値の近傍の局所最適解に到達している場合には、その解が表示されるので、warningがある旨のメッセージではなく、最終的な結果が出力されているか否かで、最適化が行えたかどうか、判断して欲しい。
+(質問を受けたので補足)
 === 強度関数を変えてみる ===
@@ 行 673: / 行 739: @@
 他にないか、頑張ってみて。
-=== テスト用 ===
+=== テスト用コード ===
 <code>
 software.debugging.diff <- data.frame(t=software.debugging$t[2:n],

Applied Statistics and Data Mining

サイト用ツール

ユーザ用ツール

差分

サイト用ツール

ページ用ツール

ユーザ用ツール

差分