热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

IterativeDeepSubspaceClustering翻译

IterativeDeepSubspaceClustering翻译摘要:近年来,由于深度神经网络具有良好的特征提取能力,深度学习已广泛
Iterative Deep Subspace Clustering 翻译

摘要:

近年来,由于深度神经网络具有良好的特征提取能力,深度学习已广泛应用于子空间聚类问题。 大多数现有方法都是基于自动编码器网络构建的。 在本文中,我们提出了一个无监督深度子空间聚类的迭代框架。 在我们的方法中,我们首先聚类给定数据以更新子空间id,然后用聚类结果更新卷积神经网络(CNN)的表示参数。 通过迭代这两个步骤,我们不仅可以获得给定数据的良好表示,而且可以获得更精确的子空间聚类结果。 对合成数据和现实世界数据的实验表明,我们的方法优于子空间聚类精度的最新技术。

1 引言

在许多计算机视觉应用中,例如人脸识别,纹理识别和运动分割,视觉数据可以通过子空间很好地表征。 此外,高维数据的内在维度通常远小于环境维度。 这推动了子空间聚类技术的发展,该技术同时将数据聚类成多个子空间,并且还为每类数据定位低维子空间。

在过去十年中已经开发了许多子空间聚类算法,包括代数,迭代,统计和谱聚类方法。 在这些方法中,由于其简单性,理论稳健性和经验上的成功,深入研究了谱聚类方法。 这些方法基于位于一个联合子空间的数据的自我表示属性。 这表明子空间中的每个点都可以写成该子空间中剩余数据点的线性组合。 落入此类别的典型方法之一是稀疏子空间聚类(SSC)。 SSC使用\boldsymbol{l}_{1}范数来鼓励自我表示系数矩阵的稀疏性。

尽管这些子空间聚类方法已经显示出令人鼓舞的性能,但我们观察到它们受到以下限制。 首先,大多数子空间聚类方法通过浅层模型学习数据表示,这可能无法捕获大数据的复杂潜在结构。 其次,这些方法需要访问整个数据集作为字典,因此难以处理大规模和动态数据集。 为了解决这些问题,我们认为深度学习可以成为一种有效的解决方案,这要归功于其卓越的表示学习能力和快速的推理速度。 事实上,[19,29,30]最近提出使用深度神经网络来学习聚类的表示。 然而,他们中的大多数并不是以端到端的方式工作,然而这通常被认为是深度学习成功的主要因素。

在这项工作中,我们的目标是在统一的框架中解决无标签图像上的子空间聚类和表示学习。 利用图像的聚类ids作为监督信号来学习表示是一种自然的想法,反过来,表示将有利于子空间聚类。 具体来说,我们首先对给定数据进行聚类以更新子空间ids,然后使用聚类结果更新卷积神经网络(CNN)的表示参数。 通过迭代这两个步骤,我们不仅可以获得给定数据的良好表示,而且可以获得更精确的子空间聚类结果。

这篇文章的主要贡献如下:

1. 我们提出了一个简单但有效的端到端学习框架,以共同学习深度表示和子空间聚类结果;

2. 我们在循环框架中制定联合学习,其中子空间聚类的合并操作表示为前向传递,CNN的表示学习作为反向传递;

3. 对合成数据和现实世界公共数据集的实验结果表明,与最先进的方法相比,我们的方法可以提高聚类精度。

2 相关工作


2.1 子空间聚类

在过去的十年中,子空间聚类方法的兴起在计算机视觉中具有各种应用,例如, 运动分割,人脸聚类图像处理,多视图分析和视频分析。 特别地,在这些工作中,基于谱聚类的方法已经实现了最先进的结果。 这些方法的关键是学习令人满意的亲和度矩阵C,其中C_{ij}表示第i个样本和第j个样本之间的相似性。 给定数据矩阵,其包含来自n个子空间的N个数据点。 SSC [7]旨在找到数据点的彼此的相似性的稀疏表示矩阵C,即X = XC。 由于S_{i}中的每个点可以用S_{i}中的其他点表示,因此总是存在这样的稀疏表示矩阵C. SSC算法通过解决以下优化问题找到C:

其中diag(C)= 0消除了平凡解。 不同的工作在C上采用不同的正则化,其中三种最受欢迎,即基于\boldsymbol{l}_{1}-范数的稀疏性[7,8],基于核规范的低秩[13,25,28]和基于Frobenius范数的稀疏性[18,21]。

2.2 深度学习

在过去几年中,大多数现有的子空间聚类方法关注于如何学习有益于发现固有聚类的良好数据表示。作为最有效的表征学习技术,深度学习已被广​​泛研究用于各种应用,特别是在监督学习的情景中[10,11]。相比之下,只有少数作品致力于无监督情景,这是深度学习所面临的主要挑战之一[6,12]。在工作[24]中,作者采用自动编码器网络进行聚类。具体来说,Tian等人 [24]在稀疏自动编码器框架中提出了一种新颖的图聚类方法。此外,Peng等人[19]通过结合深度神经网络和原始数据的稀疏性信息来执行子空间聚类,提出了一个带有sparsiTY先验的deeP subspAce clusteRing,称为PARTY。该框架在无监督学习中提取低维特征的同时实现了令人满意的性能。

3 提出的方法


3.1 问题表述

是来自不同子空间的数据点的集合。 子空间聚类的目标是根据子空间找到点的分割。 基于联合子空间中数据的自我表示属性,即子空间中的每个点可以写成该子空间中剩余点的线性组合,我们可以通过学习获得位于同一子空间中的点。 最稀疏的组合。 因此,我们需要学习稀疏的自表示系数矩阵C,其中X = XC,并且如果第i和第j个数据点来自不同的子空间,则C_{ij} = 0。

我们的迭代方法旨在同时学习数据表示和子空间聚类结果。 我们首先利用稀疏子空间聚类算法对给定数据进行聚类以更新子空间id,然后利用聚类结果更新卷积神经网络的表示参数。 通过迭代这两个步骤,我们不仅可以获得给定数据的良好表示,而且可以获得更精确的子空间聚类结果。

符号: 我们将数据矩阵表示为,其包含来自n个子空间的N个数据点。 这些数据的簇标签是。 θ是CNN参数,基于此我们获得来自X的深度表示。我们在上加上一个上标, 表示在时间步长t他们的状态。

3.2 一个迭代方法

我们提出了一个迭代框架来组合子空间聚类和表示学习过程。

如图1所示,在时间步t,我们首先聚类数据表示X以获得子空间簇标签yt。 然后将X和y输入CNN以获得表示X.因此,在时间步t

其中SSC是经典的稀疏子空间聚类方法[7],f是提取输入X的深度表示的函数,使用y^{t}训练的CNN。

由于初始化的聚类结果可能不可靠。 我们从最初的过度聚类开始。 如图2所示,我们首先将数据聚类为2个子空间,然后增加聚类数k并迭代直到达到停止标准。

在我们的迭代框架中,我们累积了所有时间步长的损失,这些损失被表述为:

我们假设所需簇的数量是n。 然后我们可以建立一个迭代过程,T = n - 1次步。 我们首先将数据聚类为2个子空间作为初始聚类。 给定这些初始聚类,我们的方法可以学习数据的深层表示。 然后,对于新的数据表示,我们将它们聚类为3个子空间,并使用更新子空间标签学习更新表示。 如算法1中所总结的,我们迭代该过程直到簇的数量达到n。 在每个迭代周期中,我们执行前向和后向传递以分别更新y和θ。 具体来说,在前向传递中,我们在每个时间步长增加一个簇。 在后向传递中,我们运行大约20个epoch来更新θ,并且还基于新表示更新亲和度矩阵C.

4 实验

 

 

 

 

 

 

 


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 深度学习与神经网络——邱锡鹏
    深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ... [详细]
  • 基于深度学习的遥感应用
    文章目录深度学习的发展过程深度学习在遥感中的应用基于深度学习的遥感样例库建设基于深度学习的遥感影像目标及场景检索基于深度学习的建筑物提取基于深度学习的密集建筑物自动检测基于深度学习 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • 论文阅读:《Bag of Tricks for LongTailed Visual Recognition with Deep Convolutional Neural Networks》
    基于深度卷积神经网络的长尾视觉识别技巧包摘要近年来,挑战性长尾分布上的视觉识别技术取得了很大的进展,主要基于各种复杂的范式(如元学习)。除了这些复杂 ... [详细]
  • 今天凌晨开始苹果正式开始了iOS10的推送工作,使用iPhone和iPad的用户可 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • ICRA2019最佳论文  Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio
    文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议:ICRA2019标题:《MakingSenseofVision ... [详细]
  • 程度|也就是_论文精读:Neural Architecture Search without Training
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文精读:NeuralArchitectureSearchwithoutTraining相关的知识,希望对你有一定的参考价值。 ... [详细]
author-avatar
鸵鸟家的大pp
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有