我知道fread
它相对较新,但它确实提供了很好的性能改进.我想知道的是,您可以从正在阅读的文件中选择行和列吗?有点像什么read.csv.sql
?我知道使用一个select
选项fread
可以选择要读取的列,但是如何只读取满足特定条件的行.
例如,可以使用以下内容实现fread
吗?
read.csv.sql(file, sql = "select V2,V4,V7,V8,V9, V10 from file where V5=='CE' and V10 >= 500",header = FALSE, sep= '|', eol ="\n")
如果这还不可能,是否建议阅读全部数据,然后使用subset
等来得出最终结果?还是会破坏使用目的fread
?
作为参考,我必须阅读大约800个文件,每个文件包含大约100,000行和10列.欢迎任何输入.
谢谢.