Lead()
函数是dplyr
包中的一个函数,用于获取向量或数据框中的领先观测(可以理解为前移)。它可以用于计算后续的值或观测,并在结果中返回一个新的向量或数据框。
lead(x)
x
:要获取领先观测的向量或数据框的列。
- n
:要领先的观测数量,默认为1。如果n
为正数,返回向量或列中的后续观测。如果n
为负数,返回向量或列中的先前观测。
- default
:可选参数,用于指定在边缘情况下(如领先观测不可用时)返回的默认值。
-
应用于向量:
输出:x <- c(1, 2, 3, 4, 5) lead(x)
上述代码获取向量2 3 4 5 NA
x
的领先观测,默认情况下领先1个观测。结果是一个新的向量,其中前面的元素为原始向量的后一个观测,最后一个元素为NA
。 -
应用于数据框的列:
输出:df <- data.frame(x = c(1, 2, 3, 4, 5), y = c(6, 7, 8, 9, 10)) lead(df$x)
2 3 4 5 NA
上述代码获取数据框df
中列x
的领先观测,默认情况下领先1个观测。结果是一个新的向量,其中前面的元素为原始向量的后一个观测,最后一个元素为NA
。
lead()
函数在时间序列分析和数据处理中经常用于计算领先值。它可以帮助我们进行观测数据的比较、计算差异等操作。