差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
mselab:2014:stat:week1:r1 [2015/01/13 10:00] watalumselab:2014:stat:week1:r1 [2015/01/13 10:03] (現在) watalu
行 3: 行 3:
  
 対象の事実を観察して、疑問や問題を明確にしてから、データをに基づいて疑問や問題の解決を図ることは、科学的探索の基本姿勢である。 対象の事実を観察して、疑問や問題を明確にしてから、データをに基づいて疑問や問題の解決を図ることは、科学的探索の基本姿勢である。
-そのための取り組みの流れの一つに、PPDACサイクルがある。Problem, Plan, Data, Analysis, Conclusionの5つのステップからなる問題解決への取り組みをPPDACと呼ぶ。この取り組みは、PからCまで素直に到達できることを保証する訳ではない。Problem, Planと進み、Dataステップで適切なデータが入手できないことが判明して、またPlanをやりなおす、などもあり得る。+そのための取り組みの流れの一つに、PPDACサイクルがある。 
 + 
 +さて、なぜPPDACを持ち出すかというと、データの解析には問題の明確化と目的の設定(P:Problem)、そして目的の設定を受けた目標の設定(P:Plan)が不可欠だからである。 
 +目的はデータの解析が目指す方向を示し、目標はどんな解析結果を得ると結論(C:Conclusion)を得られるかを示す。 
 +目的と目標とが決まれば、あとはどのようなデータ(D:Data)を収集して、どのように分析(A:Analysis)すればよいかのアプローチが定まる。 
 +分析には、層別しながらとなるが、集計やグラフなどの手作業、回帰分析などの多変量解析手法、決定木やクラスタリングなどのデータマイニング手法、サポートベクトルマシンや弱機械のブースティングなどの機械学習の手法などを用いる。求めているのは目標を達成するような分析結果であり、様々な手法はそのための手段に過ぎないことは常に認識しておく必要がある。 
 + 
 +Problem, Plan, Data, Analysis, Conclusionの5つのステップからなる問題解決への取り組みをPPDACと呼ぶ。この取り組みは、PからCまで素直に到達できることを保証する訳ではない。Problem, Planと進み、Dataステップで適切なデータが入手できないことが判明して、またPlanをやりなおす、などもあり得る。
  
 表:PPDAC 表:PPDAC
行 15: 行 22:
 前のステップをしっかりと進めた方が、次のステップが順調に進みやすい、という点でQCストーリーと似ている。 前のステップをしっかりと進めた方が、次のステップが順調に進みやすい、という点でQCストーリーと似ている。
  
- +PPDACの図は、[[https://www.google.com/search?rls=en&q=PPDAC&ie=UTF-8&oe=UTF-8|Googleさんに聞いて]]から画像検索を依頼すれば、たくさん表示されるので、ここでは載せな。最近、PPDACは[[https://www.stat.auckland.ac.nz/~wild/StatThink/|このページ]]に掲載されているカナダ発の[[https://www.stat.auckland.ac.nz/~wild/StatThink/images/99.Investigative.png|この図]]まではれると教わった。
-PPDACの図は、[[https://www.google.com/search?rls=en&q=PPDAC&ie=UTF-8&oe=UTF-8|Googleさんに聞いて]]から画像検索を依頼すれば、たくさん表示されるので、一つ、一番古と思われるもを引用しておく。 +
- +
-{{:mselab:2014:stat:week1:99.investigative.png?200|}} +
- +
-これ[[https://www.stat.auckland.ac.nz/~wild/StatThink/|このページ]]に掲載されているカナダ発の[[https://www.stat.auckland.ac.nz/~wild/StatThink/images/99.Investigative.png|この図]]で、これ以外にもたくさんの図がインターネット上には見つかる。 +
- +
-データの解析には、問題の明確化と目的の設定(P:Problem)、次いで、目的の設定を受けた目標の設定(P:Plan)が不可欠だからである。どのような問題を解決・解消するために、あるいは、どのような状況を改善するためにデータを扱うか、をず明確にする。そして、その問題や状況の現状をデータから定量的に把握する。そのために問題を明確にして、分析の目的を設定しなければ、解析の手順が容易に迷子になりうる。ヒストグラムや棒グラフを描くにせよ、クロス集計したり散布図などを描くにせよ、どの変数あるいはどの集計値(統計量とも)を基準に考え、あるいはどのような評価尺度を改善していくか、をまず明確にするのある。 +
- +
-目的(P:Problem)データの解析が目指す方向を示し、目標(P:Plan)はどんな解析結果を得ると結論(C:Conclusion)を得られるかを示す。 +
-目的目標とが決まれば、あとはどのようなデータ(D:Data)を収集して、どのように分析(A:Analysis)すればよいかのアプローチが定まる。 +
-分析には、層別しながらとなるが、集計やグラフなどの手作業、回帰分析などの多変量解析手法、決定木やクラスタリングなどのデータマイニング手法、サポートベクトルマシンや弱機械のブースティングなどの機械学習の手法などを用いる。求めているのは目標を達成するような分析結果であり、様々な手法はそのめの手段に過ぎないことは常に認識しておく必要がある。 +
- +
-このような考えの進め方にPPDACが適しているので、この実験はこれに基づいて設計した。他にも科学的探求の方法、と呼ばれるアプローチ(サイクル、取り組み方、進め方、ステップなど)は様々あるので、興味のある人は調べてみるといい+
  
 === 今年度のデータ === === 今年度のデータ ===