Lag()
函数是dplyr
包中的一个函数,用于获取向量或数据框中的滞后观测。它可以用于计算先前的值或观测,并在结果中返回一个新的向量或数据框。
lag(x)
x
:要获取滞后观测的向量或数据框的列。
- n
:要滞后的观测数量,默认为1。如果n
为正数,返回向量或列中的先前观测。如果n
为负数,返回向量或列中的后续观测。
- default
:可选参数,用于指定在边缘情况下(如滞后观测不可用时)返回的默认值。
下面是lag()
函数的示例用法:
-
应用于向量:
输出:x <- c(1, 2, 3, 4, 5) lag(x)
上述代码获取向量NA 1 2 3 4
x
的滞后观测,默认情况下滞后1个观测。结果是一个新的向量,其中第一个元素为NA
,后面的元素为原始向量的前一个观测。 -
应用于数据框的列:
输出:df <- data.frame(x = c(1, 2, 3, 4, 5), y = c(6, 7, 8, 9, 10)) lag(df$x)
上述代码获取数据框NA 1 2 3 4
df
中列x
的滞后观测,默认情况下滞后1个观测。结果是一个新的向量,其中第一个元素为NA
,后面的元素为原始向量的前一个观测。
lag()
函数在时间序列分析和数据处理中经常用于计算滞后值。它可以帮助我们进行观测数据的比较、计算差异等操作。