差分
このページの2つのバージョン間の差分を表示します。
| 次のリビジョン | 前のリビジョン | ||
| data:bank_direct_telemarketing [2014/06/26 08:04] – created watalu | data:bank_direct_telemarketing [2015/01/13 10:26] (現在) – watalu | ||
|---|---|---|---|
| 行 1: | 行 1: | ||
| - | === 銀行のテレマーケティングのデータ === | + | ==== 銀行のテレマーケティングのデータ |
| このデータはポルトガルのとある銀行の定期預金獲得キャンペーンのためのテレマーケティングに関するものである。 | このデータはポルトガルのとある銀行の定期預金獲得キャンペーンのためのテレマーケティングに関するものである。 | ||
| 行 10: | 行 10: | ||
| 提供されているのは個々のターゲットへのプロモーションの完全な記録ではなく、ある時点における個々のターゲットへのプロモーションの状態であることには留意する必要がある。このデータに基づいて、より効率のよいテレマーケティングを行うために、そのキャンペーンの記録を分析して、定期預金の誘いに応じやすいターゲット層を見つけるモデルを構築すること、がこのデータをデータマイニングする時のひとつの目標になる。 | 提供されているのは個々のターゲットへのプロモーションの完全な記録ではなく、ある時点における個々のターゲットへのプロモーションの状態であることには留意する必要がある。このデータに基づいて、より効率のよいテレマーケティングを行うために、そのキャンペーンの記録を分析して、定期預金の誘いに応じやすいターゲット層を見つけるモデルを構築すること、がこのデータをデータマイニングする時のひとつの目標になる。 | ||
| - | === データについて === | + | 同じ案件に関して、時点がずれて2種類のデータが提供されている。 |
| - | [[http:// | + | === 1つ目のデータ === |
| + | |||
| + | [[http:// | ||
| * [Moro et al., 2011] S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology. In P. Novais et al. (Eds.), Proceedings of the European Simulation and Modelling Conference - ESM' | * [Moro et al., 2011] S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology. In P. Novais et al. (Eds.), Proceedings of the European Simulation and Modelling Conference - ESM' | ||
| 行 29: | 行 31: | ||
| |10|day|last contact day of the month|(numeric)| | | |10|day|last contact day of the month|(numeric)| | | ||
| |11|month|last contact month of year|(categorical)|" | |11|month|last contact month of year|(categorical)|" | ||
| - | |12|duration|最後のコンタクト時の時間(秒) last contact duration, in seconds|(numeric)| | | + | |12|duration|最後のコール時の時間(秒) last contact duration, in seconds|(numeric)| | |
| - | |13|campaign|今回のキャンペーンでのコンタクト回数 number of contacts performed during this campaign and for this client|(numeric, | + | |13|campaign|今回のキャンペーンでの総コール回数 number of contacts performed during this campaign and for this client|(numeric, |
| - | |14|pdays|以前のキャンペーンでの最終コンタクトからの経過日数 number of days that passed by after the client was last contacted from a previous campaign |(numeric, -1 means client was not previously contacted)| | | + | |14|pdays|前回のキャンペーンでの最終コールからの経過日数 number of days that passed by after the client was last contacted from a previous campaign |(numeric, -1 means client was not previously contacted)| | |
| - | |15|previous|number of contacts performed before this campaign and for this client|(numeric)| | | + | |15|previous|今回のキャンペーン以前の総コール回数 |
| - | |16|poutcome|outcome of the previous marketing campaign|(categorical)|" | + | |16|poutcome|前回のキャンペーンの結果 |
| |17|y|has the client subscribed a term deposit? | |17|y|has the client subscribed a term deposit? | ||
| + | |||
| + | === 2つ目のデータ === | ||
| + | |||
| + | 同じく[[http:// | ||
| + | |||
| + | * [Moro et al., 2014] S. Moro, P. Cortez and P. Rita. A Data-Driven Approach to Predict the Success of Bank Telemarketing. Decision Support Systems, Elsevier, 62:22-31, June 2014 | ||
| + | |||
| + | 上の16の属性に加えて、幾つかの属性が加わり、変数も少し変わったデータである。 | ||
| + | |||
| + | |Input variables: | ||
| + | |# bank client data:||| | ||
| + | |1|age|(numeric)| | ||
| + | |2|job|type of job (categorical: | ||
| + | |3|marital|marital status (categorical: | ||
| + | |4|education|(categorical: | ||
| + | |5|default|has credit in default? (categorical: | ||
| + | |6|housing|has housing loan? (categorical: | ||
| + | |7|loan|has personal loan? (categorical: | ||
| + | |# related with the last contact of the current campaign: | ||
| + | |8|contact|contact communication type (categorical: | ||
| + | |9|month|last contact month of year (categorical: | ||
| + | |10|day_of_week|last contact day of the week (categorical: | ||
| + | |11|duration|last contact duration, in seconds (numeric). Important note: this attribute highly affects the output target (e.g., if duration=0 then y=' | ||
| + | |# other attributes: | ||
| + | |12|campaign|number of contacts performed during this campaign and for this client (numeric, includes last contact)| | ||
| + | |13|pdays|number of days that passed by after the client was last contacted from a previous campaign (numeric; 999 means client was not previously contacted)| | ||
| + | |14|previous|number of contacts performed before this campaign and for this client (numeric)| | ||
| + | |15|poutcome|outcome of the previous marketing campaign (categorical: | ||
| + | |# social and economic context attributes||| | ||
| + | |16|emp.var.rate|employment variation rate - quarterly indicator (numeric)| | ||
| + | |17|cons.price.idx|consumer price index - monthly indicator (numeric) | | ||
| + | |18|cons.conf.idx|consumer confidence index - monthly indicator (numeric) | | ||
| + | |19|euribor3m|euribor 3 month rate - daily indicator (numeric)| | ||
| + | |20|nr.employed|number of employees - quarterly indicator (numeric)| | ||
| + | |Output variable (desired target):||| | ||
| + | |21|y|has the client subscribed a term deposit? (binary: ' | ||