热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

用户画像_用户画像TGI

在用户画像的评判和验证中,TGI是一个很重要的指标。然而网上对TGI的文章和介绍很少,大多也都是阐述基本概念,连举例说明都是统一的“15-

在用户画像的评判和验证中,TGI是一个很重要的指标。然而网上对TGI的文章和介绍很少,大多也都是阐述基本概念,连举例说明都是统一的“15-24岁”人群的例子。个人前段时间做了TGI,略有些心得分享在这里,帮助对TGI有更清楚的了解。

1. TGI概念

首先还是先赘述一下TGI的概念,TGI是Target Group Index的缩写,TGI=[目标群体中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例]*标准数100。TGI指数等于100表示平均水平,高于100代表该类用户对某类特征的关注程度高于整体水平。举个简单例子,比如某客户端所有用户的男女比是60%和40%,在这些用户中,看过某体育视频的男女比是90%和10%,看过某母婴视频的男女比是20%和80%。那么该体育视频在男性中的TGI是90%/60%*100=150,女性10%/40%*100=25,该母婴视频在男性中的TGI是20%/60%*100=33.33,女性80%/40%*100=200.

概念看似简单,我刚接触TGI时有点绕的问题是,“目标群体”和“某一特征”容易混淆。像刚才体育频道的例子,把看过体育频道的用户作为“目标群体”,男性女性作为“某一特征”,“总体”指的是所有频道的用户。因为我要研究体育频道的用户,所以设置他们为“目标群体”,也就是我想研究什么,就设置哪个群体为“目标群体”,“某一特征”是我为了研究“目标群体”而选择的其中一个分类。换个角度说,假如我想研究男性或者女性用户,我就要设置男性用户为“目标群体”,看不看体育频道反而变成了“某一特征”,“总体”指的是男性用户和女性用户总和。

2. TGI适用范围

TGI的应用范围可以很广,并非仅局限于人群特征偏好度,由于TGI是用户画像中的概念,大家往往关注人群TGI。概念中的群体可以指代很多内容,比如广告点击曝光转化,文章阅读统计,数据日志等等。只要对该群体做两个或两个以上维度的类别划分,就可以计算TGI。例如广告曝光,可以按创意类别分类,也可以按投放广告所在频道分类,两种维度的分类就可以计算某类创意在某频道的TGI,或者某频道在某类创意的TGI。

3. TGI应用

在画像中,TGI的作用是研究特征和目标人群的关联度,TGI的值和100的差距越大区分度越大越有价值。刚才的举例中,25、33.33和150、200一样有很大价值,因为更大的区分度更能描绘人群的特点,也更容易聚类出相应人群。同理,TGI趋近于100的可以认为该特征对区分人群没有什么价值。通过TGI可以清晰看到某种特征的人群的喜好,发掘更多潜在用户和数据的潜在价值,像啤酒和尿不湿的故事,关联度大的特征都可以通过TGI展示出来。而且不同人群的特征关联度可以直观的比较,展示不同人群的区别。

不过TGI也有尴尬之处,它很难验证人群画像准确度,或者说很难计算出评判指标来评判画像的优劣。如果一套画像的TGI都是100,毫无疑问这个画像是很不准的。但是有区分度的画像也很难通过TGI判断它准,这是因为没有整体评价的计算,关于评判画像这一点之后会再研究。再一个比较关键的点,就是分类中数量越少的群体,TGI浮动会越大,相对越不准。假设用户中男女比是99%和1%,在性别上的TGI将没有什么价值,女性TGI会浮动很剧烈,偶然因素影响巨大,也就不具备参考价值了。

4. TGI计算

假定一个TGI应用场景是,我要分析我这个app的所有用户P中,有某种特质的用户群A的tgi。(1)首先确定好要分析哪些特征,比如年龄、性别、职业(2)然后计算出P的各个特征人数,p1、p2、...、pn。这些p值有长期使用价值,可以定时自动计算。(3)计算A的各个特征人数,a1、a2、...、an。(4)A的特征tgi,比如tgi1 = (a1/A) / (p1/P)*100,以此类推进行计算。

计算过程简单,但是有几点是要做好的。首先用户画像是基础,计算人数都是要用画像数据。然后如果要分析一堆目标用户,可以用代码循环计算。

以上是关于TGI的总结,以后有新的心得体会将继续补充。



推荐阅读
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 本文介绍了在Linux下安装和配置Kafka的方法,包括安装JDK、下载和解压Kafka、配置Kafka的参数,以及配置Kafka的日志目录、服务器IP和日志存放路径等。同时还提供了单机配置部署的方法和zookeeper地址和端口的配置。通过实操成功的案例,帮助读者快速完成Kafka的安装和配置。 ... [详细]
  • Elasticsearch1Elasticsearch入门1.1Elasticsearch术语1.1.16.0以前的Elasticsearch术语1.1.26.0以后的Elasti ... [详细]
  • 本文介绍了深入浅出Linux设备驱动编程的重要性,以及两种加载和删除Linux内核模块的方法。通过一个内核模块的例子,展示了模块的编译和加载过程,并讨论了模块对内核大小的控制。深入理解Linux设备驱动编程对于开发者来说非常重要。 ... [详细]
  • 解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法
    本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法,包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时,还介绍了修改nginx的error.log日志级别为debug,以便查看详细日志信息。 ... [详细]
  • 本文讨论了在数据库打开和关闭状态下,重新命名或移动数据文件和日志文件的情况。针对性能和维护原因,需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况,以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]
  • mysql-cluster集群sql节点高可用keepalived的故障处理过程
    本文描述了mysql-cluster集群sql节点高可用keepalived的故障处理过程,包括故障发生时间、故障描述、故障分析等内容。根据keepalived的日志分析,发现bogus VRRP packet received on eth0 !!!等错误信息,进而导致vip地址失效,使得mysql-cluster的api无法访问。针对这个问题,本文提供了相应的解决方案。 ... [详细]
  • Oracle优化新常态的五大禁止及其性能隐患
    本文介绍了Oracle优化新常态中的五大禁止措施,包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB,并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况,并提出了解决方案。 ... [详细]
  • 集成电路企业在进行跨隔离网数据交换时面临着安全性问题,传统的数据交换方式存在安全性堪忧、效率低下等问题。本文以《Ftrans跨网文件安全交换系统》为例,介绍了如何通过丰富的审批流程来满足企业的合规要求,保障数据交换的安全性。 ... [详细]
  • mac php错误日志配置方法及错误级别修改
    本文介绍了在mac环境下配置php错误日志的方法,包括修改php.ini文件和httpd.conf文件的操作步骤。同时还介绍了如何修改错误级别,以及相应的错误级别参考链接。 ... [详细]
  • 本文介绍了sqlserver云存储和本地存储的区别,云存储是将数据存储在网络上,方便查看和调用;本地存储是将数据存储在电脑磁盘上,只能在存储的电脑上查看。同时提供了几种启动sqlserver的方法。此外,还介绍了如何导出数据库的步骤和工具。 ... [详细]
  • 本文介绍了自动化测试专家Elfriede Dustin在2008年的文章中讨论了自动化测试项目失败的原因。同时,引用了IDT在2007年进行的一次软件自动化测试的研究调查结果,调查显示很多公司认为自动化测试很有用,但很少有公司成功实施。调查结果表明,缺乏资源是导致自动化测试失败的主要原因,其中37%的人认为缺乏时间。 ... [详细]
  • 在Oracle11g以前版本中的的DataGuard物理备用数据库,可以以只读的方式打开数据库,但此时MediaRecovery利用日志进行数据同步的过 ... [详细]
  • 先看一段错误日志:###Errorqueryingdatabase.Cause:com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransie ... [详细]
  • 从Oracle安全移植到国产达梦数据库的DBA实践与攻略
    随着我国对信息安全和自主可控技术的重视,国产数据库在党政机关、军队和大型央企等行业中得到了快速应用。本文介绍了如何降低从Oracle到国产达梦数据库的技术门槛,保障用户现有业务系统投资。具体包括分析待移植系统、确定移植对象、数据迁移、PL/SQL移植、校验移植结果以及应用系统的测试和优化等步骤。同时提供了移植攻略,包括待移植系统分析和准备移植环境的方法。通过本文的实践与攻略,DBA可以更好地完成Oracle安全移植到国产达梦数据库的工作。 ... [详细]
author-avatar
中二丶夜夜
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有