差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン最新のリビジョン両方とも次のリビジョン | ||
mselab:2014:stat:week1:r1 [2014/10/21 00:09] – [今週の実験手順] watalu | mselab:2014:stat:week1:r1 [2015/01/13 10:00] – watalu | ||
---|---|---|---|
行 3: | 行 3: | ||
対象の事実を観察して、疑問や問題を明確にしてから、データをに基づいて疑問や問題の解決を図ることは、科学的探索の基本姿勢である。 | 対象の事実を観察して、疑問や問題を明確にしてから、データをに基づいて疑問や問題の解決を図ることは、科学的探索の基本姿勢である。 | ||
- | そのための取り組みの流れの一つに、PPDACサイクルがある。 | + | そのための取り組みの流れの一つに、PPDACサイクルがある。Problem, |
- | + | ||
- | さて、なぜPPDACを持ち出すかというと、データの解析には問題の明確化と目的の設定(P: | + | |
- | 目的はデータの解析が目指す方向を示し、目標はどんな解析結果を得ると結論(C: | + | |
- | 目的と目標とが決まれば、あとはどのようなデータ(D: | + | |
- | 分析には、層別しながらとなるが、集計やグラフなどの手作業、回帰分析などの多変量解析手法、決定木やクラスタリングなどのデータマイニング手法、サポートベクトルマシンや弱機械のブースティングなどの機械学習の手法などを用いる。求めているのは目標を達成するような分析結果であり、様々な手法はそのための手段に過ぎないことは常に認識しておく必要がある。 | + | |
- | + | ||
- | Problem, Plan, Data, Analysis, Conclusionの5つのステップからなる問題解決への取り組みをPPDACと呼ぶ。この取り組みは、PからCまで素直に到達できることを保証する訳ではない。Problem, | + | |
表:PPDAC | 表:PPDAC | ||
行 22: | 行 15: | ||
前のステップをしっかりと進めた方が、次のステップが順調に進みやすい、という点でQCストーリーと似ている。 | 前のステップをしっかりと進めた方が、次のステップが順調に進みやすい、という点でQCストーリーと似ている。 | ||
- | PPDACの図は、[[https:// | + | |
+ | PPDACの図は、[[https:// | ||
+ | |||
+ | {{: | ||
+ | |||
+ | これは、[[https:// | ||
+ | |||
+ | データの解析には、問題の明確化と目的の設定(P: | ||
+ | |||
+ | 目的(P: | ||
+ | 目的と目標とが決まれば、あとはどのようなデータ(D: | ||
+ | 分析には、層別しながらとなるが、集計やグラフなどの手作業、回帰分析などの多変量解析手法、決定木やクラスタリングなどのデータマイニング手法、サポートベクトルマシンや弱機械のブースティングなどの機械学習の手法などを用いる。求めているのは目標を達成するような分析結果であり、様々な手法はそのための手段に過ぎないことは常に認識しておく必要がある。 | ||
+ | |||
+ | このような考えの進め方にPPDACが適しているので、この実験はこれに基づいて設計した。他にも科学的探求の方法、と呼ばれるアプローチ(サイクル、取り組み方、進め方、ステップなど)は様々あるので、興味のある人は調べてみるといい。 | ||
=== 今年度のデータ === | === 今年度のデータ === | ||
行 66: | 行 72: | ||
から、現状把握と解析でQC7つ道具を精力的に用いることになる。 | から、現状把握と解析でQC7つ道具を精力的に用いることになる。 | ||
+ | ==== 本題 ==== | ||
+ | ここからは、今週の実験手順の説明。実験はペアで行ってもらいます。最初の週に隣同士に座った2人ずつ。 | ||
- | ==== 今週の実験手順 ==== | + | - パソコンは1人1台使ってください。 |
+ | - 作業は1人のパソコンでやっても、2人で同時にやっても構いませんが、相談しながらやってください。 | ||
+ | - 作業内容は分担しても、同時に同じことをやりながら進めても構いませんが、相談しながらやってください。 | ||
+ | - 帰るときには、ペアで同じ状態(同じプログラム、同じグラフ、同じ表)を持ち帰ってください。 | ||
+ | - レポートは一人1通としてください。 | ||
+ | - すべての作業は自宅でもRをインストールすれば行えますので、帰宅後に追加作業を行っても構いません。それ以降の結果をレポート作成時に共有するか否かはお任せします。でも次の週には共有してください。 | ||
+ | - 考察は相談しても一人ずつでも構いません。 | ||
=== 最低限の準備 === | === 最低限の準備 === | ||
行 87: | 行 101: | ||
=== 最初のステップ === | === 最初のステップ === | ||
- | 新QC7つ道具のうち、親和図法と連関図法について、少し学ぶ。その次は、パートナーと[[http:// | + | 新QC7つ道具のうち、親和図法と連関図法について、少し学ぶ。 |
+ | |||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | |||
+ | その次は、パートナーと[[http:// | ||
ここでは、 | ここでは、 | ||
行 95: | 行 114: | ||
の合わせて2枚の図が成果物となる。 | の合わせて2枚の図が成果物となる。 | ||
+ | |||
+ | === 続いてRの入門 === | ||
+ | |||
+ | [[mselab: | ||
=== 以下の流れ (手作業編) === | === 以下の流れ (手作業編) === | ||
- | [[mselab: | + | 上のメモを見ながら、ネットでも調べながら、自分で頑張る。今週はたぶん、それで十分。 |
- | たぶんそれで十分。 | + | |
=== 以下の流れ (Rコマンダー編) === | === 以下の流れ (Rコマンダー編) === | ||
行 107: | 行 129: | ||
* [[http:// | * [[http:// | ||
* [[http:// | * [[http:// | ||
- | * [[http:// | + | * [[http:// |
これらを斜め読みすれば使い始めることができる簡単なソフトウェアで、今回はグラフと統計量のみを用いて、データの現状を把握し、定期預金の契約率の高いターゲット層を発見することが目標である。 | これらを斜め読みすれば使い始めることができる簡単なソフトウェアで、今回はグラフと統計量のみを用いて、データの現状を把握し、定期預金の契約率の高いターゲット層を発見することが目標である。 | ||
行 122: | 行 144: | ||
|Rコマンダーでデータを読み込む|Rコマンダー入門 第2節(p.10)| | |Rコマンダーでデータを読み込む|Rコマンダー入門 第2節(p.10)| | ||
|数値による要約|Rコマンダー入門 第3節(p.15)| | |数値による要約|Rコマンダー入門 第3節(p.15)| | ||
+ | |||
+ | === RかRコマンダーを用いて行うこと === | ||
+ | |||
+ | - 連関図法の結果のデータからの確認。 | ||
+ | * ヒストグラム(hist())や1次元の集計(table())による、各変数の分布の検討 | ||
+ | * 散布図(plot())、クロス集計(table())、箱ヒゲ図(boxplot())をうまく使い分けると、変数間の関係を検討できる | ||
+ | - データを分析しながら連関図法の改訂 | ||
+ | |||
==== レポートについて ==== | ==== レポートについて ==== | ||
- | * Rコマンダーなどで作成したグラフや表、また計算した集計値(統計値)などをレポートに含める場合、説明・報告・考察に必要なもののみを含めること。 | + | * 先週の親和図法と連関図法の結果をエクセルで作成して、ワードファイルに「横」にして貼り付け、解説すること。 |
+ | * 特に連関図法の結果について、RかRコマンダーで検討すること。それら作成したグラフや表、また計算した集計値(統計値)などをレポートに含める場合、説明・報告・考察に必要なもののみを含めること。 | ||
* 図表は読みやすいように配置すること。 | * 図表は読みやすいように配置すること。 | ||
+ |