ちょっとした関数その2、今回はunique関数です。
離散値のデータ解析中に、膨大なデータが同じ値をとることがあります。
例えば、次にデータのような場合です。
x <- sample(1:20,size=15,replace=T) #仮のデータです
x
[1] 20 17 14 4 6 2 19 6 14 14 10 4 9 14 7
今回のデータの場合は14が何度か出てきてるようです。このときどのような数字が出てきてるか?
と調べるとき、前から一つずつ数えていってはモレやダブりといったものが発生してしまう可能性があり大変です。
そこで用いるのがunique関数、
unique(x)
[1] 20 17 14 4 6 2 19 10 9 7
このようにモレやダブりなく存在する数字を返してくれます。
ちなみにそれぞれの何個存在するかも知りたい時は
table(x)
x
2 4 6 7 9 10 14 17 19 20
1 2 2 1 1 1 4 1 1 1
というように、tableを使った方が簡単です。
個数を調べたい時はtable、存在する数字を調べてそれに関して続けて解析を行いたい時はuniqueというように使い分けるといいと思います。
ちなみにuniqueは日本人には「おもしろい」とか「ユーモアのある」といったように使われてますが、英語では「固有の」とか「ただ一つの」という意味でつかわれる方が多いようです。
三国無双というゲームでゲーム中で一個しか出てこない一番強い武器はユニーク武器と呼ばれてましたがこれも「おもしろい武器」ではなく「ただ一つの武器」のほうですね。
公開日:6月15日