我正在尝试使用panda
s read_csv
或read_stata
函数读取一个有点大的数据集,但我一直在使用Memory Error
s.数据帧的最大大小是多少?我的理解是,只要数据适合内存,数据帧就应该没问题,这对我来说应该不是问题.还有什么可能导致内存错误?
对于上下文,我试图阅读2007年消费者财务调查,包括ASCII格式(使用read_csv
)和Stata格式(使用read_stata
).该文件大约为200MB作为dta,大约1.2GB作为ASCII,并且在Stata中打开它告诉我,有2200个观察/行有5,800个变量/列.