データマイニング (2016年度)

おすすめ

庄野先生の知的情報システム(月曜1限)とセットで履修していただくといいかもしれません。

連絡

  • 今年度は前年度と同じ本を用いますが、スライドが異なります。(2015.04.09)
  • 先行履修の人は、講義の時間には印鑑を持っていきます。それ以外の時間帯は、メールでアポをとって何人かでまとまってきて下さると助かります。

テキストと教材

この科目は“An Introduction to Statistical Learning” をテキストに使います。各自での購入もお勧めできる統計的学習理論の最新の入門書のひとつです。良書です。

このテキストに基づく教材には次の2種類があります。

講義ビデオは初回の方を見ていただくと、スライドを背景に著者らが楽しそうに説明していて、私が講義をせずにそれを見る自習にしても良いとも思うほどです。

日程

12016.04.07ガイダンスと第1章スライド
22016.04.14第2章の前半 統計的学習問題(予測問題)スライド
32016.04.21第2章の後半 統計的学習問題(分類問題)同上
42016.04.28続き同上
52016.05.12
62016.05.19
72016.05.26
82016.06.02
92016.06.09
102016.06.16
112016.06.23
122016.06.30
132016.07.07
142016.07.14
152016.07.21
162016.07.28

シラバス(2014.04.09改訂)

主題および達成目標

データマイニングに現れる種々の手法を、基本的な事項から始めて、手法の実装に必要な理論を解説した後、実際の問題に適用するまでの一連の過程を通じて、学んでもらう。 毎年、トピックを一つないし複数を選んで、講義する。

今年度は“An Introduction to Statistical Learning” (Springer-Verlag) をテキストに使い、データマイニングに用いられる多くの分析手法を包含する統計的学習理論について講義する。この書籍は統計的学習理論の最新の入門書のひとつで、各自での購入もお勧めできる良書である。

(2015.04.09改訂)

授業内容とその進め方

上のテキストに沿って、以下の内容について、各話題を括弧の回数で論じる。 全15回の予定である。

  1. 序論 (1週)
  2. 統計的学習 (2週)
  3. 線形回帰 (1週)
  4. 分類 (1週)
  5. リサンプリング (1週)
  6. 線形モデルの選択と正規化 (1週)
  7. 非線形モデル (1週)
  8. 樹に基づく方法 (1週)
  9. サポートベクトルマシン (1週)
  10. 教師なし学習 (1週)

残りの週は演習

(2014.04.09改訂)