我是机器学习的新手,最近几天正在尝试使用奇异值分解(SVD)。基于x和y值,我使用绘制了以下图matplotlib
。我正在检测网络用户的异常活动。在此图中,离群点很少。我想确定谁属于这些异常值。
为了使它更易于理解,我们采用以下数据集。
基于网页访问的原始矩阵。
matrix = mat( [[1,0,0,1,1,0,1,0,1,0], [1,0,0,0,1,0,1,0,1,1],[1,0,1,0,1,0,0,0,1,0],[0,1,1,1,0,1,0,1,0,0],[1,1,0,0,1,0,1,1,1,1],[0,0,1,0,1,1,0,1,0,0],[1,1,0,1,0,1,0,0,1,0],[1,0,0,0,1,0,1,1,1,1],[0,1,1,0,1,0,1,0,0,0],[1,1,0,1,0,1,0,1,1,0]] )
SVD计算后的x,y坐标。
x = [-0.34095692,-0.34044722,-0.27155318,-0.21320583,-0.44657865,-0.19587836, -0.29414279, -0.3948753 ,-0.21655774 , -0.34857087] y = [0.16305762,0.38554548, 0.10412536, -0.57981103, 0.17927523, -0.22612216, -0.34569697, 0.30463137,0.01301744,-0.42661108]
我想要的是找到谁属于给定的数据点。像明智的大数据集情节中如何找到异常值的标识?希望你理解我的问题。