総合コミュニケーション科学

実施場所

  • 1週目のみ西5-602
  • 2週目以降は西5-309

お題

KNIME

現状

目標

  • インストール、データマイニング手順に関して、例題つきのコンテンツを用意してあげよう。(PDFとウェブで)

スケジュール

月/日項目内容制作
111/27ガイダンス課題の説明なし
212/04初めてのKNIMEインストールとデータの読み込みと何かを動かしてみるところまで手引き
301/15手引きのレビュー、二回目のKNIME少しデータマイニング手引きの改訂版とルポ
401/22ルポのレビュールポの改訂版
501/29予備予備

コンテンツ準備上の注意

画面のコピーは[SHIFT]+[PRT SCRN]で撮影して、WordやPowerPointに貼っていくのが楽だが、今回はドキュメントとウェブコンテンツを作成したいので、ペイントやGIMPを使って、まずはJPGかPNGで保管してほしい。

内容

一週目

ガイダンス(のみ)

二週目

KNIMEのインストールと使用法

課題:手引き作成(年内提出)

三週目

KNIMEでデータマイニングしてみる

  • 定期預金獲得のためのテレマーケティングデータを使う
  • 決定木 (decision tree)
  • RandomForestを使ってもらおうとしたけど、準備しかできなかった
  • ニューラルネットワークも試したけど、入力ノードが連続変数である必要があったのでやめた

課題:KNIMEで決定木分析をしてみる

  1. ワークフローをつくる(前回課題と同じなので省略)
  2. とりあえず決定木分析をするにはどうすればいいか(ノードを選んでワークフローに投げ込んで実行する手順)
  3. とりあえず出てきた出力を読む(あまり営業戦略に活用できない決定木が出てきたけど、とりあえず読む)
  4. 役に立たない変数での分割は不要なので、解析から取り除くにはどうすればいいか(ノードの設定を変更して、変数を除去する)
  5. また出てきた出力を検討する
  6. 以下、この手順を繰り返すと、役に立つ決定木にたどり着ける(かもしれない)

四週目

前回はもしかしたら、レポートとして作成してくださっているかもしれません。 一番最初の回にガイダンスで説明したように、KNIMEを使ってもらいましょう、という手引き、案内が狙いです。 だから、理論はあまりどうでもよくて、結果もあまりどうでもよくて、簡単ですよ、とか、とりあえずやってみませんか、とかそういうニュアンスを醸し出してください。

課題:目的を微調整して、決定木分析をするのにKNIMEを使ってみましょう、にしてください。

  • インストールとデータの読み込みは説明しなくていいです。それは最初の課題のカバー範囲です。
  • 決定木とは何かは説明しなくていいです。決定木をKNIMEでやってみたくなる人は、決定木が何かを知っています。
  • 細かいオプションも説明しなくていいです。基準なども、使いたくなる人は知っていますし、使う人が調べればいいです。
  • 変数を解析に加えたり除いたりする手順は必須です。これがデータマイニングのプロセスの主要な部分のひとつです。
  • 「役に立つ変数」「役に立たない変数」の説明は少しお願いします。

出席者が八人だったので、二人一組での取り組みをお願いしましたが、一人いなくなってしまったので、七人になりました? 三組は二人の今日までに提出の課題を比較して、使えるところを採用し、補えるところは補ってマージしてください。 一組(一人)は、私に相談してくれたように、優しいインストラクションに改訂してください。

提出物は、成果物としてのドキュメントファイル(マイクロソフトオフィスのファイルかPDFがいいです)をお願いします。 ペアを組めた方々は、ペアで1ファイルを送ってくださっても、個別に1ファイルずつ送っていただいても構いませんが、 ペアの名前を一番最初に記してください。 学期末が近くて忙しいとは思いますが、PBLの成績報告の期限もどこかに設定されているはずですので、提出期限は来週中でお願いします。 多くの作業は今日の時間中に終わると思いますが、念のため1週間の余裕を見ます。