差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン両方とも次のリビジョン
r:survival:survfit [2018/12/11 19:21] watalur:survival:survfit [2018/12/11 19:23] watalu
行 91: 行 91:
  
 {{:r:survival:kaplan-meier-estimate-2.png|}} {{:r:survival:kaplan-meier-estimate-2.png|}}
 +
 +
 +実線の折れ線が、カプラン・マイヤー法で推定した生存関数である。1から生存関数を引けば、累積分布関数の推定ができる。このグラフからまずは、寿命分布の密度関数が一山か、二山以上か、を読み取ろうとする。
 +
 +survfitが出力した各時点でのリスクセットの大きさn.riskとその時点での故障数n.eventの比を計算すると、故障率曲線も推定できる。
 +<code>
 +X.survfit = survfit(Surv(time, status)~1, data=X)
 +X.survfit$n.event/X.survfit$n.risk
 +</code>
 +これを縦軸に、時間を横軸にとったグラフ
 +<code>
 +plot(X.survfit$time,X.survfit$n.event/X.survfit$n.risk,
 +     xlab="Time", ylab="Failure Rate")
 +</code>
 +が故障率曲線のノンパラメトリックな推定値となる。
  
 === ノンパラメトリックな推定量の長所と短所 === === ノンパラメトリックな推定量の長所と短所 ===
  
 ノンパラメトリックな推定量は、確率分布を仮定しないので、当初から色眼鏡で見ることがなく、データをそのまま吟味できるという長所を持つ。実際に観測された時点から先の予測ができない、という短所も合わせ持つ。また、精度よく確率分布を推定するには、とても大きいサンプルを必要とすることも、短所である。 ノンパラメトリックな推定量は、確率分布を仮定しないので、当初から色眼鏡で見ることがなく、データをそのまま吟味できるという長所を持つ。実際に観測された時点から先の予測ができない、という短所も合わせ持つ。また、精度よく確率分布を推定するには、とても大きいサンプルを必要とすることも、短所である。