R CSV 文件


R CSV 文件的概述

CSV(Comma Separated Values)文件是一种常见的文件格式,它是将数据以逗号分隔的方式存储在文件中。R中可以使用read.csv()write.csv()函数来读取和写入CSV文件。这些函数是R内置的,因此无须额外安装就可以使用。

读取CSV文件

read.csv()函数可以用来读取CSV格式的文件,该函数会将CSV文件转化为R数据框(data frame)的形式。下面是read.csv()函数的语法:

read.csv(file, header = TRUE, sep = ",", quote = "\"", dec = ".", fill = TRUE, stringsAsFactors = DEFAULT, na.strings = "NA", strip.white = FALSE, skip = 0, nrows = -1, check.names = TRUE, fileEncoding = "")
参数 说明
file 指定CSV文件的路径。
header 指定CSV文件是否包含标题行,其默认值为TRUE
sep 指定CSV文件中列与列之间用于分割的符号,默认值为逗号。
quote 指定CSV文件中值是否使用引号将其括起来,默认值为双引号。
dec 指定CSV文件中数值的小数点符号。
fill 指定是否填充缺失的行(当行中的字段数小于前面数据中的字段数时,会自动填充缺失的行)。
stringsAsFactors 指定是否将导入数据集中的字符向量作为因子(variables)。默认情况下,字符向量被转换为因子,并且可以通过将其设置为FALSE 转化为字符向量。
na.strings 指定用什么表示NA值(缺失数据)。
strip.white 指定读取数据时是否去除字段的前导和尾随空格,默认为FALSE
skip 指定需要跳过前多少行,以读取有效的数据。默认值为0
nrows 指定要读取的行数。
check.names 指定导入数据时是否将列名转换为有效变量名称。默认为TRUE
fileEncoding 指定CSV文件的编码方式,默认为空,如果CSV文件是非英文的,可考虑设置该参数。

下面是读取CSV文件的示例:

file_path <- './data_sample.csv'
data_df <- read.csv(file_path)
print(data_df)

写入CSV文件

write.csv()函数可以将R数据框转化为CSV格式的文件并将其保存到磁盘中。下面是write.csv()函数的语法:

write.csv(x, file, append = FALSE, quote = TRUE, sep = ",", eol = "\n", na = "NA", dec = ".", row.names = TRUE, col.names = TRUE, qmethod = "double")
参数 说明
x 指定要写入CSV文件的R数据集。
file 指定CSV文件的路径。
append 指定是否将输出追加到现有文件中,默认为FALSE,也就是创建新的文件。
quote 指定是否使用引号将值括起来,默认为TRUE
sep 指定列之间用于分隔的符号,默认为逗号。
eol 指定换行符,默认为\n
na 指定在数据集中用什么表示缺失值,默认为NA
dec 指定数值中小数点的符号。
row.names 指定是否引入行名称(row names)列,默认为TRUE
col.names 指定是否引入列名称(column names)列,默认为TRUE
qmethod 指定在转义时所使用的方法。需要指定一个单字符,表示转义的方法。默认值为double,表示使用双引号将转义字符包围。

下面是写入CSV文件的示例:

data_df <- data.frame(name = c('Alice', 'Bob', 'Cathy', 'Dan'), age = c(25, 24, 23, 27))
file_path <- './data_sample2.csv'
write.csv(data_df, file_path)

总结

在R语言中,使用CSV文件是一个常见的数据处理方式,因为CSV文件格式非常直观且易于处理。使用R自带的read.csv()函数可以轻松地将CSV文件读入R中;而使用write.csv()函数则可以将R数据框导出到CSV文件中。在实践中需要详细检查CSV文件的信息并设置好参数以确保数据的准确度和有效性。