异常检测是为了发现偏离常态的数据点。换句话说,这些点并不遵循预期的模式。离群值和异常值是用来描述异常数据的术语。异常检测在许多领域都很重要,因为它可以提供有价值和可操作的见解。例如,MR成像扫描的异常可能表明大脑中的肿瘤区域,而制造工厂传感器的异常读数可能表明损坏的部件。
离群值只是一个与特定数据集中的其他数据点有很大差异的数据点。类似地异常检测是帮助识别数据异常值的过程,或与其他大量数据点有很大偏差的点。
当涉及到大型数据集时,可能会有非常复杂的模式,仅仅通过查看数据是无法检测到的。因此为了实现关键的机器学习应用,对异常检测的研究具有重要的意义。
在数据科学领域,有三种不同的方法来对异常进行分类。正确理解它们可能会对您处理异常的方式产生重大影响。