データフレーム

多くのRの解析プログラム(パッケージ)では、データフレームという型のオブジェクトで与えたデータを扱える。

#時間故障/打ち切り
11.5故障
25.3故障
32.5故障
47.8故障
56.2故障
64.1故障
78.2故障
810.3故障
91.5故障
1013.4故障

上のデータをRに入力するには、次のコードを用いる。列名(変数名、フィールド名とも)は日本語も使えるが、英語にしてtimeとstatusにしてある。

data.frame(time=c(1.5,5.3,2.5,7.8,6.2,4.1,8.2,10.3,1.5,13.4),
          status=c(1,1,1,1,1,1,1,1,1,1))

これを実行すると次のように表示される。

   time status
1   1.5      1
2   5.3      1
3   2.5      1
4   7.8      1
5   6.2      1
6   4.1      1
7   8.2      1
8  10.3      1
9   1.5      1
10 13.4      1

打ち切りデータもある場合には、次のように打ち切りに対応するstatusを0にする。

#時間故障/打ち切り
11.5故障
25.3故障
32.5故障
47.8故障
56.2故障
64.1故障
78.2故障
810.0打ち切り
91.5故障
1010.0打ち切り
data.frame(time=c(1.5,5.3,2.5,7.8,6.2,4.1,8.2,10.0,1.5,10.0),
          status=c(1,1,1,1,1,1,1,0,1,0))
   time status
1   1.5      1
2   5.3      1
3   2.5      1
4   7.8      1
5   6.2      1
6   4.1      1
7   8.2      1
8  10.0      0
9   1.5      1
10 10.0      0

データの代入

オブジェクト(変数)へのデータの代入には、代入演算子「=」を用いる。

X = data.frame(time=c(1.5,5.3,2.5,7.8,6.2,4.1,8.2,10.3,1.5,13.4),
                status=c(1,1,1,1,1,1,1,1,1,1))

これで、先ほどのデータは「X」というオブジェクトの中に含まれる。 時間timeだけを取り出すには「$」という記号の次にメンバを指定する。
<code>
X$time </code> 故障か打ち切りかを表すメンバstatusを取り出すのも同様である。

X$status