N distinct()

函数是dplyr包中的一个函数,用于计算向量或数据框中的唯一值的数量。它返回一个整数,表示给定向量或数据框列中的唯一值的个数。

n_distinct(data)
- data:要计算唯一值数量的向量或数据框的列。

  1. 应用于向量:
    x <- c(1, 2, 3, 2, 1, 4)
    n_distinct(x)
    
    输出:
    4
    
    上述代码计算了向量x中的唯一值的数量,结果为4。
  2. 应用于数据框的列:
    df <- data.frame(x = c(1, 2, 3, 2, 1, 4), y = c("A", "B", "C", "B", "A", "D"))
    n_distinct(df$y)
    
    输出:
    4
    
    上述代码计算了数据框df中列y的唯一值的数量,结果为4。 n_distinct()函数在数据处理和统计分析中常用于计算唯一值的个数,例如计算分类变量的不同类别数量或计算去重后的观测数量。