==== データマイニング (2015年度) ==== === 連絡 === * 今年度は前年度と同じ本を用いますが、スライドが異なります。(2015.04.09) * 先行履修の人は、講義の時間には印鑑を持っていきます。それ以外の時間帯は、メールでアポをとって何人かでまとまってきて下さると助かります。 * 一つ目の課題を出しました。「各自の研究にリサンプリング法を適用することを検討しなさい」です。レポートには、各自の研究を紹介し、何(データ、モデル、理論)に基づいて何(の数値をどういう値に持っていくこと)を達成しようとしているのか、定量的な評価基準も示した上で、その評価基準の算出にリサンプリング法の適用が可能かを検討しなさい。可能な場合には、具体的な手順を示し、不可能な場合にはなぜ不可能なのかを論じること」です。4年生でまだ具体的に研究テーマが決まっていない人は、勉強中の内容、あるいは卒論テーマの候補で構いません。(2015.06.18) === テキスト === "[[http://www-bcf.usc.edu/~gareth/ISL/|An Introduction to Statistical Learning]]" をテキストに使います。各自での購入もお勧めできる統計的学習理論の最新の入門書のひとつで、良書です。[[http://www.alsharif.info/#!iom530/c21o7|去年はここにスライドとビデオがありました]]。今年はそれはアクセスできなくなっていて、代わりに[[http://www.r-bloggers.com/in-depth-introduction-to-machine-learning-in-15-hours-of-expert-videos/|著者ら自身のスライドと講義ビデオ]]が公開されています。 講義ビデオはスライドを背景に著者らが楽しそうに説明していて、私が講義をせずにそれを見る自習にしても良いとも思いました。 === 日程 === |1|2015.04.09|ガイダンスと第1章|[[https://class.stanford.edu/c4x/HumanitiesScience/StatLearning/asset/introduction.pdf|スライド]]| |2|2015.04.16|第2章の前半 統計的学習問題(予測問題)| | |3|2015.04.23|第2章の後半 統計的学習問題(分類問題|)| |4|2015.05.02| | | |5|2015.05.07| | | |6|2015.05.14| | | |7|2015.05.21| | | |8|2015.05.28| | | |9|2015.06.04|休講(国内出張のため)| | |10|2015.06.11| | | |11|2015.06.17| | | |12|2015.06.25| | | |13|2015.07.02| | | |14|2015.07.09| | | |15|2015.07.16| | | |16|2015.07.23| | | === シラバス(2014.04.09改訂) === == 主題および達成目標 == データマイニングに現れる種々の手法を、基本的な事項から始めて、手法の実装に必要な理論を解説した後、実際の問題に適用するまでの一連の過程を通じて、学んでもらう。 毎年、トピックを一つないし複数を選んで、講義する。 今年度は"An Introduction to Statistical Learning" (Springer-Verlag) をテキストに使い、データマイニングに用いられる多くの分析手法を包含する統計的学習理論について講義する。この書籍は統計的学習理論の最新の入門書のひとつで、各自での購入もお勧めできる良書である。 (2015.04.09改訂) == 授業内容とその進め方 == 上のテキストに沿って、以下の内容について、各話題を括弧の回数で論じる。 全15回の予定である。 - 序論 (1週) - 統計的学習 (2週) - 線形回帰 (1週) - 分類 (1週) - リサンプリング (1週) - 線形モデルの選択と正規化 (1週) - 非線形モデル (1週) - 樹に基づく方法 (1週) - サポートベクトルマシン (1週) - 教師なし学習 (1週) 残りの週は演習 (2014.04.09改訂)