差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

次のリビジョン
前のリビジョン
mselab:2014:stat:week1:r1 [2014/10/20 23:37] – created watalumselab:2014:stat:week1:r1 [2015/01/13 10:03] (現在) watalu
行 66: 行 66:
 から、現状把握と解析でQC7つ道具を精力的に用いることになる。 から、現状把握と解析でQC7つ道具を精力的に用いることになる。
  
 +==== 本題 ====
  
-=== 解析準備 ===+ここからは、今週実験手順の説明。実験はペアで行ってもらいます。最初の週に隣同士に座った2人ずつ。
  
-とりあえず今週はRコマンダーを使う。Rコマンダーについては、下記のURLがとても参考になる。+  - パソコンは1人1台使ってください。 
 +  - 作業は1人のパソコンでやっても、2人で同時にやっても構いませんが、相談しながらやってください。 
 +  - 作業内容は分担しても、同時に同じこをやながら進めても構いませんが、相談しながらやってください。 
 +  - 帰るときに、ペアで同じ状態(同じプログラム、同じグラフ、同じ表)を持ち帰ってください。 
 +  - レポートは一人1通としてください。 
 +  - すべての作業は自宅でもRをイストールすれば行えますので、帰宅後に追加作業を行っても構いません。それ以降の結果をレポート作成時に共有するか否かはお任せします。でも次の週には共有してください。 
 +  - 考察は相談しても一人ずつでも構いません。 
 + 
 +=== 最低限の準備 === 
 + 
 +  - [[data:bank_direct_telemarketing|このページ]]でも紹介している[[http://stat.inf.uec.ac.jp/dokuwiki/lib/exe/fetch.php?media=mselab:2013:stat:week1:bank.zip|古いデータが入っているZIPファイル]]をウンロドし、中から「bank-full.csv」取り出す。このファイルは、Cドライブの自分のホームディレクトリ(現在はC:¥Users¥Student)に置く。 
 +  - Rを起動し、中で<code> 
 +bank <- read.table("c:¥¥Users¥¥Student¥¥bank-full.csv",  
 +                   header=TRUE,  
 +                   sep=";"
 +</code>を実行して、データをbankといデータ・フレームに読み込む 
 +  - 必要に応じて、追加パッケージもインストールしてみる。例えば<code> 
 +Sys.setenv("http_proxy"="http://130.153.8.19:8080/"
 +install.packages(c("Rcmdr", "RcmdrPlugin.EZR"), dependencies = TRUE) 
 +</code>を実行してから<code> 
 +library(Rcmdr) 
 +</code>を実行すると、EZR入りのRコマンダーが起動される。 
 + 
 +=== 最初のステップ === 
 + 
 +新QC7つ道具のうち、親和図法と連関図法について、少し学ぶ。 
 + 
 +  * [[http://fk-plaza.jp/Solution/solu_nqc7_2.htm|親和図法]] 
 +  * [[http://fk-plaza.jp/Solution/solu_nqc7_1.htm|連関図法]] 
 + 
 +その次、パートナーと[[http://stat.inf.uec.ac.jp/dokuwiki/doku.php?id=data:bank_direct_telemarketing|これだけの情報]]から出発して、ネットを使って情報を収集しながら、このデータについての情報を膨らましつつ、{{:mselab:2014:stat:week1:stat2014-prework-by-n7.xlsx|このExcelファイルの中の問い}}に答えながら、データ解析のためのPPDACの最初のPと2つめのPを進める。ここでの作業は「ブレーンストーミング」とその結果の体系化、なので、相手のいうことを批判してはだめ。 
 + 
 +ここでは、 
 + 
 +  - 親和図法の結果としての図が1枚。 
 +  - 連関図法の結果としての図が1枚。 
 + 
 +の合わせて2枚の図が成果物となる。 
 + 
 +=== 続いてRの入門 === 
 + 
 +[[mselab:2014:stat:week1:r1:r-introduction|こちら]]をさらっと眺めておくといい。 
 + 
 +=== 以下の流れ (手作業編) === 
 + 
 +上のメモを見ながら、ネットでも調べながら、自分で頑張る。今週はたぶん、それで十分。 
 + 
 +=== 以下の流れ (Rコマンダー編) === 
 + 
 +Rコマンダーを使うなら、下記のURLがとても参考になる。
  
   * [[http://mjin.doshisha.ac.jp/R/38/38.html|Rcmdr (1)]]   * [[http://mjin.doshisha.ac.jp/R/38/38.html|Rcmdr (1)]]
   * [[http://mjin.doshisha.ac.jp/R/39/39.html|Rcmdr (2)]]   * [[http://mjin.doshisha.ac.jp/R/39/39.html|Rcmdr (2)]]
-  * [[http://www.ec.kansai-u.ac.jp/user/arakit/documents/Getting-Started-with-the-Rcmdr-ja.pdf|Rコマンダー入門]]+  * [[http://www.ec.kansai-u.ac.jp/user/arakit/documents/Getting-Started-with-the-Rcmdr-ja20140902.pdf|Rコマンダー入門]]
  
 これらを斜め読みすれば使い始めることができる簡単なソフトウェアで、今回はグラフと統計量のみを用いて、データの現状を把握し、定期預金の契約率の高いターゲット層を発見することが目標である。 これらを斜め読みすれば使い始めることができる簡単なソフトウェアで、今回はグラフと統計量のみを用いて、データの現状を把握し、定期預金の契約率の高いターゲット層を発見することが目標である。
- 
-=== 今回の流れ === 
  
   - まずはRコマンダー入門など、上のリンク先にざっと目を通しながら、Rコマンダーに慣れる。   - まずはRコマンダー入門など、上のリンク先にざっと目を通しながら、Rコマンダーに慣れる。
行 90: 行 138:
 |Rコマンダーでデータを読み込む|Rコマンダー入門 第2節(p.10)| |Rコマンダーでデータを読み込む|Rコマンダー入門 第2節(p.10)|
 |数値による要約|Rコマンダー入門 第3節(p.15)| |数値による要約|Rコマンダー入門 第3節(p.15)|
 +
 +=== RかRコマンダーを用いて行うこと ===
 +
 +  - 連関図法の結果のデータからの確認。
 +    * ヒストグラム(hist())や1次元の集計(table())による、各変数の分布の検討
 +    * 散布図(plot())、クロス集計(table())、箱ヒゲ図(boxplot())をうまく使い分けると、変数間の関係を検討できる
 +  - データを分析しながら連関図法の改訂
  
 ==== レポートについて ==== ==== レポートについて ====
  
-  * Rコマンダーなどで作成したグラフや表、また計算した集計値(統計値)などをレポートに含める場合、説明・報告・考察に必要なもののみを含めること。+  * 先週の親和図法と連関図法の結果をエクセルで作成して、ワードファイルに「横」にして貼り付け、解説すること。 
 +  * 特に連関図法の結果について、RかRコマンダーで検討すること。それら作成したグラフや表、また計算した集計値(統計値)などをレポートに含める場合、説明・報告・考察に必要なもののみを含めること。
   * 図表は読みやすいように配置すること。   * 図表は読みやすいように配置すること。