==== 総合コミュニケーション科学 ==== === 実施場所 === * 1週目のみ西5-602 * 2週目以降は西5-309 === お題 === 「[[http://www.knime.org|KNIME]]」 === 現状 === * あまり日本語での情報が多くない * [[http://infocom-science.jp/product/detail/knimeenterpriseserver.html|インフォコム社]] * https://crowdsolving.jp/node/285 * http://ibisforest.org/index.php?KNIME * http://www.ibm.com/developerworks/jp/devops/library/d-agile-data-analysis-R-integration/ * http://lab.synergy-marketing.co.jp/blog/statistic/data-mining/knime-classification1 * 手ほどきのコンテンツがない === 目標 === * インストール、データマイニング手順に関して、例題つきのコンテンツを用意してあげよう。(PDFとウェブで) === スケジュール === |回|月/日|項目|内容|制作| |1|11/27|ガイダンス|課題の説明|なし| |2|12/04|初めてのKNIME|インストールとデータの読み込みと何かを動かしてみるところまで|手引き| |3|01/15|手引きのレビュー、二回目のKNIME|少しデータマイニング|手引きの改訂版とルポ| |4|01/22|ルポのレビュー|ルポの改訂版| |5|01/29|予備|予備| === コンテンツ準備上の注意 === 画面のコピーは[SHIFT]+[PRT SCRN]で撮影して、WordやPowerPointに貼っていくのが楽だが、今回はドキュメントとウェブコンテンツを作成したいので、ペイントやGIMPを使って、まずはJPGかPNGで保管してほしい。 ==== 内容 ==== === 一週目 === ガイダンス(のみ) === 二週目 === KNIMEのインストールと使用法 課題:手引き作成(年内提出) === 三週目 === KNIMEでデータマイニングしてみる * 定期預金獲得のためのテレマーケティングデータを使う * 決定木 (decision tree) * RandomForestを使ってもらおうとしたけど、準備しかできなかった * ニューラルネットワークも試したけど、入力ノードが連続変数である必要があったのでやめた 課題:KNIMEで決定木分析をしてみる - ワークフローをつくる(前回課題と同じなので省略) - とりあえず決定木分析をするにはどうすればいいか(ノードを選んでワークフローに投げ込んで実行する手順) - とりあえず出てきた出力を読む(あまり営業戦略に活用できない決定木が出てきたけど、とりあえず読む) - 役に立たない変数での分割は不要なので、解析から取り除くにはどうすればいいか(ノードの設定を変更して、変数を除去する) - また出てきた出力を検討する - 以下、この手順を繰り返すと、役に立つ決定木にたどり着ける(かもしれない) === 四週目 === 前回はもしかしたら、レポートとして作成してくださっているかもしれません。 一番最初の回にガイダンスで説明したように、KNIMEを使ってもらいましょう、という手引き、案内が狙いです。 だから、理論はあまりどうでもよくて、結果もあまりどうでもよくて、簡単ですよ、とか、とりあえずやってみませんか、とかそういうニュアンスを醸し出してください。 課題:目的を微調整して、決定木分析をするのにKNIMEを使ってみましょう、にしてください。 * インストールとデータの読み込みは説明しなくていいです。それは最初の課題のカバー範囲です。 * 決定木とは何かは説明しなくていいです。決定木をKNIMEでやってみたくなる人は、決定木が何かを知っています。 * 細かいオプションも説明しなくていいです。基準なども、使いたくなる人は知っていますし、使う人が調べればいいです。 * 変数を解析に加えたり除いたりする手順は必須です。これがデータマイニングのプロセスの主要な部分のひとつです。 * 「役に立つ変数」「役に立たない変数」の説明は少しお願いします。 出席者が八人だったので、二人一組での取り組みをお願いしましたが、一人いなくなってしまったので、七人になりました? 三組は二人の今日までに提出の課題を比較して、使えるところを採用し、補えるところは補ってマージしてください。 一組(一人)は、私に相談してくれたように、優しいインストラクションに改訂してください。 提出物は、成果物としてのドキュメントファイル(マイクロソフトオフィスのファイルかPDFがいいです)をお願いします。 ペアを組めた方々は、ペアで1ファイルを送ってくださっても、個別に1ファイルずつ送っていただいても構いませんが、 ペアの名前を一番最初に記してください。 学期末が近くて忙しいとは思いますが、PBLの成績報告の期限もどこかに設定されているはずですので、提出期限は来週中でお願いします。 多くの作業は今日の時間中に終わると思いますが、念のため1週間の余裕を見ます。