我有大svmlight文件,我正在用于机器学习目的.我试图看看这些文件的总和是否会导致足够好的结果.
我想提取我的文件的随机行,以将它们提供给我的模型,但我想在RAM中加载较少的信息.
我在这里看到(从Python中的文件中读取一些随机行),我可以使用linecache,但所有解决方案最终都会将所有内容加载到内存中.
有人可以给我一些提示吗?谢谢.
编辑:忘了说我事先知道我文件中的行数.