文書の過去の版を表示しています。
+目次
銀行のテレマーケティングのデータ
このデータはポルトガルのとある銀行の定期預金獲得キャンペーンのためのテレマーケティングに関するものである。
- ポルトガルはユーラシア大陸の最西端の共和制国家。国土は北海道より1割大きいぐらい、あるいは九州を縦に2個並べたぐらい、人口は1千万人を少し超えたぐらい、GDPは約2400億ドル。首都はリスボン。
- テレマーケティングとは、電話を掛けて勧誘をするマーケティング手法のこと。
- データの取得期間は2008年5月から2010年11月までの2年半で、この期間に実施した45211人へのテレマーケティングの結果が記録されている。
- 効率のよいテレマーケティングの定義には少なくとも、勧誘の成功率の高いターゲット層(打率、シュート成功率、のようなもの)、勧誘すれば成功する潜在顧客が多いターゲット層(打数、シュート成功回数、のようなもの)の2種類は考えられそう。
提供されているのは個々のターゲットへのプロモーションの完全な記録ではなく、ある時点における個々のターゲットへのプロモーションの状態であることには留意する必要がある。このデータに基づいて、より効率のよいテレマーケティングを行うために、そのキャンペーンの記録を分析して、定期預金の誘いに応じやすいターゲット層を見つけるモデルを構築すること、がこのデータをデータマイニングする時のひとつの目標になる。
データについて
ここからダウンロードできるはずだが、たまにアクセスできないことがあるので、こちらにも置かせて頂いておく。このデータの概要はUSING DATA MINING FOR BANK DIRECT MARKETING: AN APPLICATION OF THE CRISP-DM METHODOLOGYという文献に記されている。
- [Moro et al., 2011] S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology. In P. Novais et al. (Eds.), Proceedings of the European Simulation and Modelling Conference - ESM'2011, pp. 117-121, Guimarães, Portugal, October, 2011. EUROSIS.
フィールド(変数)はぜんぶで17あり、フィールドの種類は3種類である。
フィールド番号 | フィールド名 | メモ | 種類 | その他 |
1 | age | 年齢 | (numeric) | |
2 | job | 仕事 | (categorical) | “admin.” 経営者(?), “unknown” 不明, “unemployed” 無職, “management” 管理職(?), “housemaid” メイド, “entrepreneur” 起業家, “student” 学生, “blue-collar” 労働者, “self-employed” 自営業, “retired” 退職者, “technician” 技術者, “services” サービス業 |
3 | marital | 結婚状況 marital status | (categorical) | “married” 既婚, “divorced” 離婚・死別 ; note: “divorced” means divorced or widowed, “single” 未婚 |
4 | education | 教育 | (categorical) | “unknown” 不明, “secondary” 中等教育, “primary” 初等教育, “tertiary” 高等教育 |
5 | default | 破産暦 has credit in default? | (binary) | “yes” 有, “no” 無 |
6 | balance | 平均年間残高 average yearly balance, in euros | (numeric) | |
7 | housing | 住宅ローン has housing loan? | (binary) | “yes” 有, “no” 無 |
8 | loan | 個人ローン has personal loan? | (binary) | “yes” 有, “no” 無 |
9 | contact | 最後のコンタクト手段 contact communication type | (categorical) | “unknown” 不明, “telephone” 電話, “cellular” 携帯電話 |
10 | day | last contact day of the month | (numeric) | |
11 | month | last contact month of year | (categorical) | “jan”, “feb”, “mar”, …, “nov”, “dec” |
12 | duration | 最後のコンタクト時の時間(秒) last contact duration, in seconds | (numeric) | |
13 | campaign | 今回のキャンペーンでのコンタクト回数 number of contacts performed during this campaign and for this client | (numeric, includes last contact) | |
14 | pdays | 以前のキャンペーンでの最終コンタクトからの経過日数 number of days that passed by after the client was last contacted from a previous campaign | (numeric, -1 means client was not previously contacted) | |
15 | previous | number of contacts performed before this campaign and for this client | (numeric) | |
16 | poutcome | outcome of the previous marketing campaign | (categorical) | “unknown”,“other”,“failure”,“success” |
17 | y | has the client subscribed a term deposit? | (binary) | “yes”,“no” |