N distinct()
函数是dplyr
包中的一个函数,用于计算向量或数据框中的唯一值的数量。它返回一个整数,表示给定向量或数据框列中的唯一值的个数。
n_distinct(data)
- 应用于向量:
输出:
x <- c(1, 2, 3, 2, 1, 4) n_distinct(x)
上述代码计算了向量4
x
中的唯一值的数量,结果为4。 - 应用于数据框的列:
输出:
df <- data.frame(x = c(1, 2, 3, 2, 1, 4), y = c("A", "B", "C", "B", "A", "D")) n_distinct(df$y)
上述代码计算了数据框4
df
中列y
的唯一值的数量,结果为4。n_distinct()
函数在数据处理和统计分析中常用于计算唯一值的个数,例如计算分类变量的不同类别数量或计算去重后的观测数量。