Inner join()

Pasted image 20231023230251 在函数中，您可以使用多个参数来指定内连接的行为。以下是inner_join()函数中常用参数的详细介绍和示例：

inner_join(x,y,by="key", )

x、y：要连接的两个数据框（或数据表）。
by：指定用于连接的共享变量的名称，可以是一个字符向量或变量名。如果两个数据框中的变量名称相同，则可以省略此参数。默认为Null
suffix：指定在两个数据框中存在同名但不相等的变量时，用于区分这些变量的后缀。默认情况下，后缀为 ".x" 和 ".y" 用于区分。

library(dplyr)

df1 <- data.frame(ID = c(1, 2, 3, 4),
                  value1 = c("A", "B", "C", "D"))

df2 <- data.frame(ID = c(2, 3, 5, 6),
                  value2 = c("X", "Y", "Z", "W"))

joined_df <- inner_join(df1, df2, by = "ID", suffix = c(".left", ".right"))

print(joined_df)

输出：

  ID value1 value2
1  2      B      X
2  3      C      Y

在上述示例中，我们有两个数据框：df1和df2。它们都包含一个名为"ID"的共享变量。使用inner_join()函数，我们基于"ID"列对两个数据框进行内连接。suffix参数设置为c(".left", ".right")，用于区分两个数据框中存在的同名但不相等的变量。内连接操作会在两个数据框中找到匹配的行，并将它们合并到一个新的数据框中。只有在两个数据框中都存在的ID才会出现在结果中。上述示例还展示了如何使用suffix参数来区分两个数据框中具有相同名称但不相等的变量。这可以避免变量名冲突。