我一直在玩一些SVM实现,我想知道 - 将特征值标准化以适应一个范围的最佳方法是什么?(从0到1)
假设我有3个功能,其值范围为:
3 - 5.
0.02 - 0.05
10-15.
如何将所有这些值转换为[0,1]的范围?
如果在训练期间,我将遇到的特征编号1的最高值为5,并且在我开始在更大的数据集上使用我的模型之后,我会偶然发现高达7的值?然后在转换范围内,它将超过1 ......
如何在训练期间对值进行标准化,以解释"野外值"超过训练期间"看到"模型的最高(或最低)值的可能性?如果发生这种情况,模型将如何对此作出反应以及如何使其正常工作?