热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

微信流量识别和分析的几个方法

DPI和DFI传统方法•传统的报文检测仅分析IP包的ISO层4以下的内容,包括源地址、目的地址、源端口、目的端口以及协议类型。•DPI,DeepPacketInspection,深度包检测•基于应





DPIDFI传统方法

•传统的报文检测仅分析IP包的ISO层4以下的内容,包括源地址、目的地址、源端口、目的端口以及协议类型。 •DPI,Deep Packet Inspection,深度包检测 •基于应用层的流量检测和控制技术 •DFI,Dynamic Flow Inspection,动态流检测 •基于检测数据流基于五元组的到达过程、间隔等特征的检测技术




微信识别方法总括:



•基于人工拨测的bit-level级的DPI检测方法
•基于机器学习的检测方法:Flow-level,Packet-level,Bit-level.


方法一:人工拨测DPI的检测方法



机器学习-样本集选取


•机器学习过程:建立模型和分类。•建立模型:采用训练数据( 样本) 建立分类模型; •分类:基于该模型产生一个分类器对未知数据集进行分类。•建立样本集•人工拨测•自动拨测•DPI,对现网数据深度解析,导出host数据


方法二:Flow-Level分析:


•采用期望最大化算法(EM)来识别不同应用每个连接的网络流量,并采用总包数、上行平均包大小、下行平均包大小、总时延、邻包间隔时延这五个流量统计特征来标示。统计得出微信的五个流量统计特征。•缺点:训练时间较长,可以用以下前置步骤缓解。•改进:利用K-means和DBSCAN的聚类方法来对流量进行初步分类并大致识别微信的五个流量统计特征。这两种方法可以在较短的时间内构造出所需的模型。•缺点:分类的准确度有所下降•这两种方法都要提前指定某些参数的值,当选取不当时,需要较多的实验。

方法三:Packet-level流量分析



方法四:Bit-Level流量分析




微信流量分析思路


•从原始流量中提取有意义的特征属性。因为准确的特征选取是模型构建的基础, 只有选取的特征有效, 才能对网络流量进行有意义的划分, 它们决定了流量分类模型的有效性。
•流量分类模型的构建与有效性。融合各种聚类、分类技术的思想, 综合利用不同算法的优点, 采用两阶段的分析方法: 用聚类的方法进行离线学习, 用分类的方法进行在线分类,使得构建的流量分类与应用识别模型能够在动态变化的网络中进行主动学习, 降低训练时间, 提高其泛化能力。•将人的指导信息引入模型构建过程。人的指导信息有助于分析不同应用的流量特征、选择合适的流量分类算法, 从而进一步提高流量分类模型的有效性。


推荐阅读
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文由编程笔记#小编整理,主要介绍了关于数论相关的知识,包括数论的算法和百度百科的链接。文章还介绍了欧几里得算法、辗转相除法、gcd、lcm和扩展欧几里得算法的使用方法。此外,文章还提到了数论在求解不定方程、模线性方程和乘法逆元方面的应用。摘要长度:184字。 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 学习SLAM的女生,很酷
    本文介绍了学习SLAM的女生的故事,她们选择SLAM作为研究方向,面临各种学习挑战,但坚持不懈,最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想,同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了在CentOS上安装Python2.7.2的详细步骤,包括下载、解压、编译和安装等操作。同时提供了一些注意事项,以及测试安装是否成功的方法。 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • Android工程师面试准备及设计模式使用场景
    本文介绍了Android工程师面试准备的经验,包括面试流程和重点准备内容。同时,还介绍了建造者模式的使用场景,以及在Android开发中的具体应用。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 深入解析Linux下的I/O多路转接epoll技术
    本文深入解析了Linux下的I/O多路转接epoll技术,介绍了select和poll函数的问题,以及epoll函数的设计和优点。同时讲解了epoll函数的使用方法,包括epoll_create和epoll_ctl两个系统调用。 ... [详细]
author-avatar
表发给上完善
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有