热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

宽带用户行为模式研究

转载自:http:www.hbtelecom.com.cndetail.asp?news_id78369_______________________________
转载自 :http://www.hbtelecom.com.cn/detail.asp?news_id=78369

_____________________________________________________________


  一、国内外研究现状

  虽然宽带用户渗透率不断增加,但是有关宽带用户行为的研究论文仍然是凤毛麟角。原因很简单,很难从运营商得到研究所需要的数据,大量的日志数据被认为是敏感数据而不能公开。

   目前,在国内的相关研究中,马力、 焦李成等在系统研究Internet的用户行为特征的基础上,从监测和分析的角度,给出了因特网用户行为的一种分类 方式及表示方式。刘培刚等基于国内外最新研究成果对电子商务中应用的web 挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题,给 出了基于web日志的客户群体模糊聚类算法及web页面聚类算法。棘 涌、陈恩红等人提供了一种用神经网络时Web用户的行为进行分析的方法。首先对 www服务器的日志文件进行分析,再进行会话划分,并从会话向量中拽出频繁数据集,以便选取合适的会话向量,进行规一化处理后生成模式向量,并采用 Kohonen的SOFM 模型进行聚类,最后生成用户聚类。总的来讲,国内的研究主要集中在理论探讨或从web服务的角度来进行用户行为分析。

   相比国内的研究,国外研究更注重实际应用,也比较系统和深入。很多国外研究从用户实际调查的角度,定性地给出了宽带用户的行为特征,比如  Pew Internet & American life进行的调查显示随着宽带进入家庭后,宽带用户的行为变化。同时,很多学者对电子商务 应用、近来颇受关注的p2p应用、宽带视频应用等由于宽带而兴起的新应用的用户访问特征进行了深入的研究,比如: D. Menásce and V. Almeida. 等人的《Scaling for E-business:technologies,  models, performance and capacity planning.》;C. Costa, I. Cunha,  A. Borges, C. Ramos, M. Rocha,J. Almeida, and B. Ribeiro-Neto等人的 《 Analyzing client interactivity in streaming media.》; 以及T. Hamada,  K. Chujo, T. Chujo, and X. Yang.等人的《 Peer-to- peer traffic in metro networks: analysis, modeling and policies.》。真正系统研究 用户行为特征的非常少,比如Humberto T. Marques Nt等人从运营商的角度,把宽带用户划分成两类,家庭和办公两类,分别分析两类用户 的会话级以及访问级的行为特征,计算了两类CMBG(用户的行为模式图)。

  二、本文所做的工作

  与以前的研究不同 的是,本文主要对客户端的流量分析包括对不同应用的多种请求特征分析。不仅分析用户产生的流量特征,特别还精确分析在宽带用户的一个会话期内用户对不同应 用的请求特征。同时,本文还对武汉宽带市场上宽带用户进行细分,分为:普通家庭宽带用户、公司宽带用户,针对不同类用户利用以上方法进行对比分析。

  三、结果分析

  1、计费方式。  

  从宽带用户总的应用分布来看,传统应用除www外,如ftp、telnet、pop3、smtp等比列逐步减少,一些新的应用如流媒体、P2P、游戏等比例不断增加,成为主要的服务。其中p2p占用了大量的出口带宽资源,特别是p2p下载和视频。可以给出两个建议:

   (1)由于宽带用户大量使用bt等p2p下载工具,占用大量的带宽资源,普通用户挤占高端用户带宽,导致出口流量价值下降,服务水平下降,为此作为运营 商可以考虑在出口进行p2p高峰时段控制;(2)另一方面,由于p2p视频应用的不断发展,使得p2p应用逐步运营成为可能,并且很容易摆脱运营商的限 制,所以作为运营商,要及时跟踪进展,利用网络优势,自己运营有效益的p2p增值应用。

  2、会话到达过程
在这一部分,我们主要是分析用户会话到达过程的特征。为了避免数据汇总造成的误差,我们选取了大量的用户会话到达率稳定时段,涵盖了一天中的不同时段,一星期中的不同天,包括周末。
我们发现用户会话发起间隔时间无论是家庭用户或公司用户都是呈现对数分布。普通家庭宽带用户的λ范围更小,说明在一天中公司用户通常在工作时间上网,而家庭用户上网次数频次更高。

  3、会话持续时间
为了避免数据的重叠,我们采用了不同天的数据来分析普通家庭和公司宽带用户的会话持续时间,分别给出了某一天的所有发起的会话分布特征,持续多天。

   我们发现普通家庭用户的会话持续时间可以通过对数分布精确的估计,然而,公司用户的会话持续时间对于主体部分最好利用复合对数分布,对于尾部则通过柏拉 图分布,分界点在12小时左右。我们估计这种行为反映了两种不同种类的用户:(1)在工作时候仍然挂在网上,(2)用户在网上工作很长时间,甚至离开工作 岗位仍挂在网上。值得注意的是,一个普通家庭用户会话持续时间为5到13小时,而一个公司用户平均持续时间为7到19小时。

  4、出、入流量
这 一部分分析用户每个会话中流入和流出的流量特征。我们发现无论普通家庭用户和公司用户的出入流量均很好地符合对数分布,分析结果表明,相对于家庭用户,公 司用户收到和发送更多的流量,也许与会话时间更长有关。并且流出流入的流量比在3—5的范围,与窄带相比小很多,可能与用户大量使用P2P应用有关。

  总之,相对于公司用户,普通住宅用户每天发起更多的会话,但会话平均时间更短,每次会话的流入和流出流量更少。

  5、用户请求模式   

   我们现在再来研究用户在一个会话中对不同应用的访问请求模式。我们的分析集中在常见应用。假定我们用户请求访问的服务具有内在不同特征,下一步我们就要 计算用户对每个服务访问的频率和在一个会话中在不同应用间转换的频率。我们的分析涵盖了六类典型的用户行为模式。由于处理空间的限制,我们选取至少在总会 话数种占3%的类别。

  在普通家庭和公司用户的工作流中,会话可以进一步地分为主要的两类超级类。一类会话主要有http支配,但也包 含一些其它的用户比如e-mail,及时消息和P2P服务。此超级类包含了普通家庭用户中的1、2、3类,公司用户中的1、2、3和4类。相比主要由 Http请求的类别,含有e-mail和聊天应用的用户在每次会话持续时间变长,流量变大,换句话说,用户在互联网上交流用了更多的时间。

  第二个超级类主要被P2P请求所支配。平均来看,他们持续时间更长,流量更大,远远超过由http所支配的类别。
值得注意的是,不论是普通家庭用户还是公司用户,应用的环回(应用又回到该类应用)概率非常大,换言之,用户经常重复使用同一类应用。

  四、结论

  主要研究结论如下:

   普通家庭用户和公司用户会话间隔时间、会话时间、流入流出流量呈对数分布。然而家庭用户会话到达率在白天较高,公司用户在一天的会话到达率变化很大。另 外,一个典型的公司用户会话时间较长,并且传输的数据流量更大。对于两类用户的应用请求模式研究结果显示,在每类用户中主要有两组用户,第一组主要使用传 统的internet服务,比如www,e-mail和及时消息等;第二组主要使用p2p应用,并且第二组会话时间相对较长,数据量也很大。
相关建议如下:

  1)引入分时计费产品,改善流量拥塞,扩充网络带宽资源;
  2)为提高流量价值,考虑流量计费方式。
  3)由于宽带用户大量使用bt等p2p下载工具,占用大量的带宽资源,普通用户挤占高端用户带宽,导致出口流量价值下降,服务水平下降,为此作为运营商可以考虑在出口进行p2p高峰时段控制;
  4)由于p2p视频应用的不断发展,使得p2p应用逐步运营成为可能,并且很容易摆脱运营商的限制。所以,作为运营商,要及时跟踪进展,利用网络优势,自己运营有效益的p2p增值应用。


        (课题承担单位:武汉市分公司数据维护中心)

湖北电信  
推荐阅读
  • FastDFS Nginx 扩展模块的源代码解析与技术剖析
    FastDFS Nginx 扩展模块的源代码解析与技术剖析 ... [详细]
  • 本文探讨了利用Java实现WebSocket实时消息推送技术的方法。与传统的轮询、长连接或短连接等方案相比,WebSocket提供了一种更为高效和低延迟的双向通信机制。通过建立持久连接,服务器能够主动向客户端推送数据,从而实现真正的实时消息传递。此外,本文还介绍了WebSocket在实际应用中的优势和应用场景,并提供了详细的实现步骤和技术细节。 ... [详细]
  • 2016-2017学年《网络安全实战》第三次作业
    2016-2017学年《网络安全实战》第三次作业总结了教材中关于网络信息收集技术的内容。本章主要探讨了网络踩点、网络扫描和网络查点三个关键步骤。其中,网络踩点旨在通过公开渠道收集目标信息,为后续的安全测试奠定基础,而不涉及实际的入侵行为。 ... [详细]
  • MongoDB高可用架构:深入解析Replica Set机制
    MongoDB的高可用架构主要依赖于其Replica Set机制。Replica Set通过多个mongod节点的协同工作,实现了数据的冗余存储和故障自动切换,确保了系统的高可用性和数据的一致性。本文将深入解析Replica Set的工作原理及其在实际应用中的配置和优化方法,帮助读者更好地理解和实施MongoDB的高可用架构。 ... [详细]
  • 如何在Java中高效构建WebService
    本文介绍了如何利用XFire框架在Java中高效构建WebService。XFire是一个轻量级、高性能的Java SOAP框架,能够简化WebService的开发流程。通过结合MyEclipse集成开发环境,开发者可以更便捷地进行项目配置和代码编写,从而提高开发效率。此外,文章还详细探讨了XFire的关键特性和最佳实践,为读者提供了实用的参考。 ... [详细]
  • Nginx入门指南:从零开始掌握基础配置与优化技巧
    Nginx入门指南:从零开始掌握基础配置与优化技巧 ... [详细]
  • Panabit应用层流量管理解决方案
    Panabit是一款国内领先的应用层流量管理解决方案,提供高度开放且免费的专业服务,尤其擅长P2P应用的精准识别与高效控制。截至2009年3月25日,该系统已实现对多种网络应用的全面支持,有效提升了网络资源的利用效率和安全性。 ... [详细]
  • 利用Flask框架进行高效Web应用开发
    本文探讨了如何利用Flask框架高效开发Web应用,以满足特定业务需求。具体案例中,一家餐厅希望每天推出不同的特色菜,并通过网站向顾客展示当天的特色菜。此外,还增加了一个介绍页面,在bios路径下详细展示了餐厅主人、厨师和服务员的背景和简介。通过Flask框架的灵活配置和简洁代码,实现了这一功能,提升了用户体验和餐厅的管理水平。 ... [详细]
  • 本文深入探讨了 hCalendar 微格式在事件与时间、地点相关活动标记中的应用。作为微格式系列文章的第四篇,前文已分别介绍了 rel 属性用于定义链接关系、XFN 微格式增强链接的人际关系描述以及 hCard 微格式对个人和组织信息的描述。本次将重点解析 hCalendar 如何通过结构化数据标记,提高事件信息的可读性和互操作性。 ... [详细]
  • CentOS 7环境下Jenkins的安装与前后端应用部署详解
    CentOS 7环境下Jenkins的安装与前后端应用部署详解 ... [详细]
  • TypeScript 实战分享:Google 工程师深度解析 TypeScript 开发经验与心得
    TypeScript 实战分享:Google 工程师深度解析 TypeScript 开发经验与心得 ... [详细]
  • 如果程序使用Go语言编写并涉及单向或双向TLS认证,可能会遭受CPU拒绝服务攻击(DoS)。本文深入分析了CVE-2018-16875漏洞,探讨其成因、影响及防范措施,为开发者提供全面的安全指导。 ... [详细]
  • 本文深入探讨了Spring Cloud Eureka在企业级应用中的高级使用场景及优化策略。首先,介绍了Eureka的安全配置,确保服务注册与发现过程的安全性。接着,分析了Eureka的健康检查机制,提高系统的稳定性和可靠性。随后,详细讨论了Eureka的各项参数调优技巧,以提升性能和响应速度。最后,阐述了如何实现Eureka的高可用性部署,保障服务的连续性和可用性。通过这些内容,开发者可以更好地理解和运用Eureka,提升微服务架构的整体效能。 ... [详细]
  • 端口转发(Port Forwarding)类似于服务重定向,许多路由器中也称其为虚拟服务器(Virtual Server)。通过合理配置端口转发,可以实现外部网络对内部网络中特定设备和服务的高效访问,从而提高通信效率和灵活性。此外,正确设置端口转发还能增强网络安全,确保只有授权的流量能够进入内网,有效防止未授权访问和潜在威胁。 ... [详细]
  • 读书笔记来自图解HTTP1.HTTP的缺点 通信使用明文(不加密),内容可能会被窃听不验证通信方的身份,因此有可能遭遇伪装无 ... [详细]
author-avatar
等待的承诺灬_231
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有