WngWai的简易博客

N distinct()

wngwai.github.io

N distinct()

函数是dplyr包中的一个函数，用于计算向量或数据框中的唯一值的数量。它返回一个整数，表示给定向量或数据框列中的唯一值的个数。

n_distinct(data)

- data：要计算唯一值数量的向量或数据框的列。

应用于向量：
```
x <- c(1, 2, 3, 2, 1, 4)
n_distinct(x)
```
输出：
```
4
```
上述代码计算了向量x中的唯一值的数量，结果为4。
应用于数据框的列：
```
df <- data.frame(x = c(1, 2, 3, 2, 1, 4), y = c("A", "B", "C", "B", "A", "D"))
n_distinct(df$y)
```
输出：
```
4
```
上述代码计算了数据框df中列y的唯一值的数量，结果为4。 n_distinct()函数在数据处理和统计分析中常用于计算唯一值的个数，例如计算分类变量的不同类别数量或计算去重后的观测数量。