差分
このページの2つのバージョン間の差分を表示します。
| 次のリビジョン | 前のリビジョン | ||
| dm:2014 [2014/04/09 10:51] – created watalu | dm:2014 [2014/06/26 11:45] (現在) – watalu | ||
|---|---|---|---|
| 行 1: | 行 1: | ||
| + | ==== データマイニング (2014年度) ==== | ||
| + | === 連絡 === | ||
| + | |||
| + | * 今年度は講義の内容をテキスト、内容ともに改めることにしました。{{: | ||
| + | |||
| === テキスト === | === テキスト === | ||
| " | " | ||
| + | === 日程 === | ||
| + | |||
| + | |1|2014.04.10|ガイダンス| | ||
| + | |2|2014.04.17|1章 | | ||
| + | |3|2014.04.24|2章前半 | | ||
| + | |4|2014.05.01|2章後半 | | ||
| + | |5|2014.05.08|3章 線形回帰モデル| | ||
| + | |6|2014.05.15|自習| | ||
| + | |7|2014.05.22|4章前半 ロジスティック回帰モデル| | ||
| + | |8|2014.05.29|4章後半 線形判別関数と二次判別関数| | ||
| + | |9|2014.06.05|5章 | | ||
| + | |10|2014.06.12|6章 | | ||
| + | |11|2014.06.19|8章前半 | | ||
| + | |12|2014.06.26|8章後半 | | ||
| + | |13|2014.07.03| | | ||
| + | |14|2014.07.10| | | ||
| + | |15|2014.07.17| | | ||
| + | |16|2014.07.24| | | ||
| + | |||
| + | === シラバス(2014.04.09改訂) === | ||
| + | == 主題および達成目標 == | ||
| + | |||
| + | データマイニングに現れる種々の手法を、基本的な事項から始めて、手法の実装に必要な理論を解説した後、実際の問題に適用するまでの一連の過程を通じて、学んでもらう。 毎年、トピックを一つないし複数を選んで、講義する。 | ||
| + | |||
| + | 今年度は" | ||
| + | |||
| + | (2014.04.09改訂) | ||
| + | |||
| + | == 授業内容とその進め方 == | ||
| + | |||
| + | 上のテキストに沿って、以下の内容について、各話題を括弧の回数で論じる。 | ||
| + | 全15回の予定である。 | ||
| + | |||
| + | - 序論 (1週) | ||
| + | - 統計的学習 (2週) | ||
| + | - 線形回帰 (1週) | ||
| + | - 分類 (1週) | ||
| + | - リサンプリング (1週) | ||
| + | - 線形モデルの選択と正規化 (1週) | ||
| + | - 非線形モデル (1週) | ||
| + | - 樹に基づく方法 (1週) | ||
| + | - サポートベクトルマシン (1週) | ||
| + | - 教師なし学習 (1週) | ||
| + | |||
| + | 残りの週は演習 | ||
| + | |||
| + | (2014.04.09改訂) | ||
| + | |||
| + | === 1章 === | ||
| + | == 準備 == | ||
| + | |||
| + | 今回のテキストにはRという言語が用いられていて、これを使うとほぼすべてのデータを図示しているグラフやデータの解析結果が再現できる。著者よりコードも提供されている。なので、各自、Rを使える環境を整えておくことを勧める。 | ||
| + | |||
| + | Rはおよそ、日常触れるノートパソコン以上の大きさのコンピュータにはインストールできる。[[http:// | ||
| + | インストーラが用意されていない環境については、ソースを入手して自分でビルドすればいい。 | ||
| + | |||
| + | 本学では、大抵の「パソコン」はプライベートIPで運用されていて、[[https:// | ||
| + | < | ||
| + | Sys.setenv(" | ||
| + | </ | ||
| + | |||
| + | === 4週 === | ||
| + | |||
| + | 課題提出先は、紙で当日に提出してください。 | ||
| + | |||
| + | === 12週 === | ||
| + | |||
| + | [[data: | ||
| + | |||
| + | * k最近接法 knn() ([[http:// | ||
| + | * ロジスティック判別 glm() ([[http:// | ||
| + | * フィッシャーの判別関数 lda(), qda() ([[http:// | ||
| + | * 決定木 tree() ([[http:// | ||
| + | |||
| + | を用いて、契約の予測モデルを構築し、比較せよ。 | ||
| + | |||
| + | 上のデータを展開すると、bank-full.csv というファイルが得られるので、これをホームに置くと | ||
| + | |||
| + | < | ||
| + | bank <- read.table("/ | ||
| + | </ | ||
| + | |||
| + | で読み込むことができる。細かいことは、各自に任せるが、このデータは分類変数が多いので、結果の読み込みに少し戸惑うかもしれない。 | ||
| + | |||
| + | 課題は2週間後の講義の際に、紙で提出してください。 | ||