Package readxl

read_excel()¶

在 R 语言中，readxl 包中的 read_excel() 函数用于读取 Excel 文件数据。它提供了灵活的功能，可以从 Excel 文件中读取不同的工作表、指定读取的行列范围，以及处理日期和时间数据等。下面是对 read_excel() 函数的参数进行详细介绍和举例：

函数语法：

read_excel(path, sheet = 1, range = NULL, col_names = TRUE, col_types = NULL, na = "", trim_ws = TRUE, skip = 0, n_max = Inf, guess_max = min(1000, n_max), progress = show_progress(), .name_repair = "unique", .xlsx_format(path))

参数说明： - path：一个字符向量，表示 Excel 文件的路径或 URL。 - sheet：一个字符向量或整数，表示要读取的工作表名称或索引。默认为 1，表示读取第一个工作表。 - range：一个字符向量，表示要读取的单元格范围。格式为 "A1:B10"，其中 "A1" 表示起始单元格，"B10" 表示结束单元格。默认为 NULL，表示读取整个工作表。 - col_names：一个逻辑值或字符向量，用于指定是否读取列名。如果为 TRUE，则读取列名；如果为 FALSE，则不读取列名；如果为字符向量，则指定自定义的列名。默认为 TRUE。 - col_types：一个字符向量，用于指定每列的数据类型。例如，"numeric" 表示数值型，"character" 表示字符型，"date" 表示日期型。默认为 NULL，表示自动推断数据类型。 - na：一个字符向量，表示 Excel 中用于表示缺失值的字符。默认为 ""，表示空字符串。 - trim_ws：一个逻辑值，用于指定是否去除单元格中的前导和尾随空格。默认为 TRUE。 - skip：一个整数，表示跳过读取的行数。默认为 0，表示不跳过任何行。 - n_max：一个正整数，表示读取的最大行数。默认为 Inf，表示读取所有行。 - guess_max：一个正整数，表示用于自动推断列类型的最大行数。默认为 min(1000, n_max)，即最多使用 1000 行进行类型推断。 - progress：一个函数，用于显示读取进度的回调函数。默认为 show_progress()。 - .name_repair：一个字符向量，用于指定列名修复策略。默认为 "unique"，表示自动修复冲突的列名。 - .xlsx_format：一个字符向量，表示 Excel 文件的格式。默认为 .xlsx_format(path)。

返回值： 函数返回一个数据框，包含从 Excel 文件读取的数据。

示例： 下面是使用 read_excel() 函数读取 Excel 文件数据的示例：

# 安装并加载 readxl 包
install.packages("readxl")
library(readxl)

# 读取 Excel 文件中的数据
data <- read_excel("path/to/file.xlsx", sheet = "Sheet1", range = "A1:B10")

# 打印读取的数据
print(data)

在上述示例中，我们首先安装并加载了 readxl 包。然后，我们使用 read_excel() 函数读取 Excel 文件中的数据，指定要读取的工作表名称为 "Sheet1"，要读取的单元格范围为 "A1:B10"。最后，我们打印出读取的数据。

你可以根据需要调整参数，例如指定其他工作表、自定义列名、指定数据类型等。根据 Excel 文件的结构和内容，适当调整参数可以正确读取和处理数据。