差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
最新のリビジョン両方とも次のリビジョン
mselab:2016:stat:week1 [2017/10/31 12:26] watalumselab:2016:stat:week1 [2017/10/31 12:27] watalu
行 28: 行 28:
 このような考えの進め方にPPDACが適しているので、この実験はこれに基づいて設計した。他にも科学的探求の方法、と呼ばれるアプローチ(サイクル、取り組み方、進め方、ステップなど)は様々あるので、興味のある人は調べてみるといい。 このような考えの進め方にPPDACが適しているので、この実験はこれに基づいて設計した。他にも科学的探求の方法、と呼ばれるアプローチ(サイクル、取り組み方、進め方、ステップなど)は様々あるので、興味のある人は調べてみるといい。
  
-=== 今年度のデータ ===+ 
 +==== 本題 ==== 
 + 
 +ここからは、実験手順の説明。実験はペアで行ってもらいます。最初の週に隣同士に座った2人ずつ。 
 + 
 +  - パソコンは1人1台使ってください。 
 +  - 作業は1人のパソコンでやっても、2人で同時にやっても構いませんが、相談しながらやってください。 
 +  - 作業内容は分担しても、同時に同じことをやりながら進めても構いませんが、相談しながらやってください。 
 +  - 帰るときには、ペアで同じ状態(同じプログラム、同じグラフ、同じ表)を持ち帰ってください。 
 +  - レポートは一人1通としてください。 
 +  - すべての作業は自宅でもRをインストールすれば行えますので、帰宅後に追加作業を行っても構いません。それ以降の結果をレポート作成時に共有するか否かはお任せします。でも次の週には共有してください。 
 +  - 考察は相談しても一人ずつでも構いません。 
 + 
 +=== 最低限の準備 === 
 + 
 +[[http://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/statmed.html|ここ]]からEZRのインストーラをダウンロードしてインストールするか、あるいはインストール済みのRにEZRを追加インストールするか、を選んでください。以下は、後者の場合の手順。 
 + 
 +  - [[data:the_insurance_company_benchmark|このページ]]に目を通すこと。データの読み込み手順も記述してある。 
 +  - 必要に応じて、追加パッケージもインストールしてみる。例えば<code> 
 +Sys.setenv("http_proxy"="http://130.153.8.19:8080/"
 +install.packages(c("Rcmdr", "RcmdrPlugin.EZR"), dependencies = TRUE) 
 +</code>を実行してから<code> 
 +library(Rcmdr) 
 +</code>を実行すると、EZR入りのRコマンダーが起動される。 
 + 
 +=== 最初のステップ === 
 + 
 +データを分析・解析・マイニング・サイエンスする、あらゆる場合に、データに触れる前に、おおよその中身についての思いを巡らす。データの全体像を大まかに入れる箱を、まずは頭の中に用意する、とも言える。心の準備とも言えるが、この段階をきちんと経ないと、ビジョンやイメージを持てなくて、容易に迷子になる。 
 + 
 +その次は、パートナーと[[data:the_insurance_company_benchmark|これだけの情報]]から出発して、ネットを使って情報を収集しながら、このデータについての情報を膨らましつつ、{{:mselab:2014:stat:week1:stat2014-prework-by-n7.xlsx|このExcelファイルの中の問い}}に答えながら、データ解析のためのPPDACの最初のPと2つめのPを進める。ここでの作業は「ブレーンストーミング」とその結果の体系化、なので、相手のいうことを批判してはだめ。 
 + 
 +ここでは、 
 + 
 +  - 親和図法の結果としての図が1枚。 
 +  - 連関図法の結果としての図が1枚。 
 + 
 +の合わせて2枚の図が成果物となる。 
 + 
 +=== 続いてRの入門 === 
 + 
 +[[mselab:2014:stat:week1:r1:r-introduction|こちら]]をさらっと眺めておくといい。 
 + 
 +=== 以下の流れ (手作業編) ===
  
 [[data:the_insurance_company_benchmark|保険会社の顧客データ]]を用いる。このデータの背景と概要については、リンク先のページを参照のこと。 [[data:the_insurance_company_benchmark|保険会社の顧客データ]]を用いる。このデータの背景と概要については、リンク先のページを参照のこと。
  
-=== 問題の確認 (PPDACのPとP) ====+== 問題の確認 (PPDACのPとP) ==
  
 今年はデータに触れる前に、まずは実験のペア同士で[[data:the_insurance_company_benchmark|保険会社の顧客データ]]のページを眺めながら、このデータについてディスカッションすること。ディスカッションの目的は次の2つ。 今年はデータに触れる前に、まずは実験のペア同士で[[data:the_insurance_company_benchmark|保険会社の顧客データ]]のページを眺めながら、このデータについてディスカッションすること。ディスカッションの目的は次の2つ。
行 44: 行 86:
   * [[http://fk-plaza.jp/Solution/solu_nqc7_1.htm|連関図法]]   * [[http://fk-plaza.jp/Solution/solu_nqc7_1.htm|連関図法]]
  
-=== 現状の把握 (PPDACのD) ===+== 現状の把握 (PPDACのD) ==
  
 まずはデータの変数一覧を眺めて相談しながら、V86とどの変数が関係ありそうか、どの変数が関係なさそうか、をExcelなどに変数表をコピーして、表を作って整理する。 まずはデータの変数一覧を眺めて相談しながら、V86とどの変数が関係ありそうか、どの変数が関係なさそうか、をExcelなどに変数表をコピーして、表を作って整理する。
行 55: 行 97:
 あるいは、特性要因図を作ってもいい。魚の頭がV86。 あるいは、特性要因図を作ってもいい。魚の頭がV86。
  
-=== QC7つ道具 (手法の説明のみ) ===+== QC7つ道具 (手法の説明のみ) ==
  
 前置きが長くなったが、今回はQC7つ道具の幾つかを用いて、データを解析してもらう。 前置きが長くなったが、今回はQC7つ道具の幾つかを用いて、データを解析してもらう。
行 81: 行 123:
 から、現状把握と解析でQC7つ道具を精力的に用いることになる。 から、現状把握と解析でQC7つ道具を精力的に用いることになる。
  
-==== 本題 ==== 
- 
-ここからは、今週の実験手順の説明。実験はペアで行ってもらいます。最初の週に隣同士に座った2人ずつ。 
- 
-  - パソコンは1人1台使ってください。 
-  - 作業は1人のパソコンでやっても、2人で同時にやっても構いませんが、相談しながらやってください。 
-  - 作業内容は分担しても、同時に同じことをやりながら進めても構いませんが、相談しながらやってください。 
-  - 帰るときには、ペアで同じ状態(同じプログラム、同じグラフ、同じ表)を持ち帰ってください。 
-  - レポートは一人1通としてください。 
-  - すべての作業は自宅でもRをインストールすれば行えますので、帰宅後に追加作業を行っても構いません。それ以降の結果をレポート作成時に共有するか否かはお任せします。でも次の週には共有してください。 
-  - 考察は相談しても一人ずつでも構いません。 
- 
-=== 最低限の準備 === 
- 
-[[http://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/statmed.html|ここ]]からEZRのインストーラをダウンロードしてインストールするか、あるいはインストール済みのRにEZRを追加インストールするか、を選んでください。以下は、後者の場合の手順。 
- 
-  - [[data:the_insurance_company_benchmark|このページ]]に目を通すこと。データの読み込み手順も記述してある。 
-  - 必要に応じて、追加パッケージもインストールしてみる。例えば<code> 
-Sys.setenv("http_proxy"="http://130.153.8.19:8080/") 
-install.packages(c("Rcmdr", "RcmdrPlugin.EZR"), dependencies = TRUE) 
-</code>を実行してから<code> 
-library(Rcmdr) 
-</code>を実行すると、EZR入りのRコマンダーが起動される。 
- 
-=== 最初のステップ === 
- 
-データを分析・解析・マイニング・サイエンスする、あらゆる場合に、データに触れる前に、おおよその中身についての思いを巡らす。データの全体像を大まかに入れる箱を、まずは頭の中に用意する、とも言える。心の準備とも言えるが、この段階をきちんと経ないと、ビジョンやイメージを持てなくて、容易に迷子になる。 
- 
-その次は、パートナーと[[data:the_insurance_company_benchmark|これだけの情報]]から出発して、ネットを使って情報を収集しながら、このデータについての情報を膨らましつつ、{{:mselab:2014:stat:week1:stat2014-prework-by-n7.xlsx|このExcelファイルの中の問い}}に答えながら、データ解析のためのPPDACの最初のPと2つめのPを進める。ここでの作業は「ブレーンストーミング」とその結果の体系化、なので、相手のいうことを批判してはだめ。 
- 
-ここでは、 
- 
-  - 親和図法の結果としての図が1枚。 
-  - 連関図法の結果としての図が1枚。 
- 
-の合わせて2枚の図が成果物となる。 
- 
-=== 続いてRの入門 === 
- 
-[[mselab:2014:stat:week1:r1:r-introduction|こちら]]をさらっと眺めておくといい。 
- 
-=== 以下の流れ (手作業編) === 
- 
-上のメモを見ながら、ネットでも調べながら、自分で頑張る。今週はたぶん、それで十分。 
  
 === 以下の流れ (Rコマンダー編) === === 以下の流れ (Rコマンダー編) ===