差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
mselab:2012:stat:week2 [2012/10/23 11:59] – [実験の流れ] watalumselab:2012:stat:week2 [不明な日付] (現在) – 外部編集 (不明な日付) 127.0.0.1
行 22: 行 22:
     * 標準化残差     * 標準化残差
     * 変数増減法     * 変数増減法
-  - 保険データの回帰分析、に取り組む +  - 保険データの回帰分析、に取り組む (保険データの回帰分析) 
-  - 回帰分析の結果に基づいて、訪問ルール +    - 回帰係数の推定 
-  - 必要に応じて、回帰分析の修正と訪問ルールの作成を繰り返す+    - 分散分析によるモデルの有意性の検討や回帰係数の有意性の検討 
 +    - てこ比や標準化残差などの検討 
 +    - 変数の増減 
 +    - 以上を繰り返す 
 +  - 回帰分析の結果に基づいて、訪問する顧客層を絞り込む (訪問ルール成) 
 +  - 必要に応じて、保険データの回帰分析と訪問ルールの作成を繰り返す
  
  
行 283: 行 288:
     * このWikiページのPDFファイル     * このWikiページのPDFファイル
     * ticdata2000.txt     * ticdata2000.txt
 +  * 回帰分析の結果から標準化残差とテコ比の散布図を描くとき、配布資料では残差を標準化するのに、「残差の平方和を残差の自由度で割ったもの」を誤差分散の推定値としますが、Rでは「残差の標本分散」を誤差分散の推定値としています。第5章の例題では、それぞれ「残差平方和/7」と「残差平方和/9」ですので、Rが描く標準化残差のグラフはすべて、配布資料よりも9/7だけ原点から拡大されることになります。(0211p)
 +  * V1は使わないのがおすすめ。番号の順序に意味がなく、各コードごとの頻度を集計させると、次のようになるため。(0237p) <code>
 +> table(tic.learn$V1)
 +  1                  10  11  12  13  15  16  17  18  19  20 
 +124  82 249  52  45 119  44 339 278 165 153 111 179    16    19    25 
 + 21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39 
 + 15  98 251 180  82  48  50  25  86 118 205 141 810 182 214 225 132 339 328 
 + 40  41 
 + 71 205 
 +</code>
 +  * 保険商品ごとに難易度が異なります。V86が一番簡単。
  
 +|V|0|1|2|3|4|5|6|
 +|V75|5426|382|14| | | | |
 +|V76|5529|173|100|11|8|1| |
 +|V77|5791|31| | | | | |
 +|V78|5784|38| | | | | |
 +|V79|5799|19|4| | | | |
 +|V80|2666|3017|126|7|3|2|1|
 +|V81|5819|3| | | | | |
 +|V82|5789|31|2| | | | | 
 +|V83|5675|111|34|2| | | |
 +|V84|5777|44|1| | | | |
  
 === 参考 === === 参考 ===