实际上我正在使用OpenCV的svm python接口,我正在尝试将数据分为4类.当标签和训练数据按顺序排列时,我的意思是例如数据分为4组,标签为1,标签2,标签3和标签4,正确的比例很低,只有50%左右.但是当我改组训练数据时,结果是合理的,大约90%是正确的.所以我的问题是:训练数据顺序是否会影响最终结果,还是我需要在训练前将数据洗牌?
不,它不会改变SVM培训,尽管代码中使用的某些参数调整方法可能取决于排序.例如 - 如果你在没有随机化的情况下使用交叉验证,那么有序集合就更难了(ach连续的折叠甚至可以有一些类的0个样本!).
简而言之:
SVM培训不依赖于数据排序
一些基于库的工具用作"附加方法"可以依赖于它