热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

clickhouse之bitmap

文章目录1.bitmap知多少2.clickhouse中的bitmap2.1bitmap与array类型的转换2.2bitmap获取属性的函数2.3bitmap集合运算3.clic

文章目录

  • 1. bitmap知多少
  • 2. clickhouse中的bitmap
    • 2.1 bitmap与array类型的转换
    • 2.2 bitmap获取属性的函数
    • 2.3 bitmap集合运算
  • 3. clickhouse+bitmap的使用场景
    • 3.1 用户画像


1. bitmap知多少

bitmap(位图)是一种利用比特位来进行数据存储的结构,简单举例:存储1-8的整数,如果我们用整数数组的话,至少需要4(1个int型整数按4字节)*8=32个字节的存储空间,但是如果用bitmap的话,我们只需要1个字节(8bit),从低位到高位,每一位是否为1即可表示该数是否存在。显然,使用bitmap能够显著节省用户存储空间,但也有一些局限性:

  • 存储的数据不能过于稀疏,比如只有1和10000两个数,那也需要10000/8=1250个字节
  • 数据中不能出现重复,因为每一位只有0和1,只能表示该数存在或不存在

正因为上述特性,经常有一些面试中会考到bitmap的使用:

  • 给你40亿个不重复的整数,判断其中是否存在某个给定的整数,但是只有1G的内存
  • 10亿个整数中出现重复的整数个数
  • 10亿个数中只有1位为空,找出为空的那个数?内存只有几十兆的情况下怎么处理?

…诸如此类的各种变体,总有一款难住你,哈哈~~

和bitmap原理类似的还有更复杂一点儿的布隆过滤器(BloomFilter)。

2. clickhouse中的bitmap

bitmap在clickhouse中是一种AggregateFunction的数据类型,其构造方法有两种:

  1. 通过聚合函数groupBitmap来构造
  2. 通过对整形数组进行转换得到

2.1 bitmap与array类型的转换


  • bitmapBuild:将array转换为bitmap

select bitmapBuild([1,2,3,4,5]) as res, toTypeName(res);

在这里插入图片描述

  • bitmapToArray:将bitmap转为array

select bitmapToArray(bitmapBuild([1,2,3,4,5])) as res, toTypeName(res);

在这里插入图片描述

2.2 bitmap获取属性的函数

clickhouse提供了一系列函数来获取bitmap的属性,比如最大值、最小值、基数等。

2.3 bitmap集合运算

clickhouse同样提供了一系列函数来进行bitmap之间的集合运算,包括并集、交集、差集、补集等。
具体使用可查阅官方文档:bitmap函数

3. clickhouse+bitmap的使用场景

3.1 用户画像


  • 存储结构:按标签+用户ID列表的方式来进行存储,其中用户ID列表使用bitmap类型来节省存储空间。
  • 使用方法:通过标签可以快速找到相关人群进行推荐;对于多个标签查找共性用户的需求,可以通过bitmap集合运算函数来快速得到。

推荐阅读
  • 本文介绍了使用哈夫曼树实现文件压缩和解压的方法。首先对数据结构课程设计中的代码进行了分析,包括使用时间调用、常量定义和统计文件中各个字符时相关的结构体。然后讨论了哈夫曼树的实现原理和算法。最后介绍了文件压缩和解压的具体步骤,包括字符统计、构建哈夫曼树、生成编码表、编码和解码过程。通过实例演示了文件压缩和解压的效果。本文的内容对于理解哈夫曼树的实现原理和应用具有一定的参考价值。 ... [详细]
  • 本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计,并以数字赋能和创新驱动高质量发展的理念,建设了集成、智慧、高效的一体化城市综合管理平台,促进了城市的数字化转型。该中心被称为当代城市的智能心脏,为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • 安卓select模态框样式改变_微软Office风格的多端(Web、安卓、iOS)组件库——Fabric UI...
    介绍FabricUI是微软开源的一套Office风格的多端组件库,共有三套针对性的组件,分别适用于web、android以及iOS,Fab ... [详细]
  • 本文介绍了P1651题目的描述和要求,以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术,将问题转化为求解差值的问题,并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • 如何在php中将mysql查询结果赋值给变量
    本文介绍了在php中将mysql查询结果赋值给变量的方法,包括从mysql表中查询count(学号)并赋值给一个变量,以及如何将sql中查询单条结果赋值给php页面的一个变量。同时还讨论了php调用mysql查询结果到变量的方法,并提供了示例代码。 ... [详细]
  • 本文讨论了在openwrt-17.01版本中,mt7628设备上初始化启动时eth0的mac地址总是随机生成的问题。每次随机生成的eth0的mac地址都会写到/sys/class/net/eth0/address目录下,而openwrt-17.01原版的SDK会根据随机生成的eth0的mac地址再生成eth0.1、eth0.2等,生成后的mac地址会保存在/etc/config/network下。 ... [详细]
  • 第四章高阶函数(参数传递、高阶函数、lambda表达式)(python进阶)的讲解和应用
    本文主要讲解了第四章高阶函数(参数传递、高阶函数、lambda表达式)的相关知识,包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念,并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说,本文将是一个不错的学习资料。 ... [详细]
  • 本文介绍了在CentOS上安装Python2.7.2的详细步骤,包括下载、解压、编译和安装等操作。同时提供了一些注意事项,以及测试安装是否成功的方法。 ... [详细]
  • 先看官方文档TheJavaTutorialshavebeenwrittenforJDK8.Examplesandpracticesdescribedinthispagedontta ... [详细]
  • This article discusses the efficiency of using char str[] and char *str and whether there is any reason to prefer one over the other. It explains the difference between the two and provides an example to illustrate their usage. ... [详细]
  • 本文由编程笔记#小编整理,主要介绍了关于数论相关的知识,包括数论的算法和百度百科的链接。文章还介绍了欧几里得算法、辗转相除法、gcd、lcm和扩展欧几里得算法的使用方法。此外,文章还提到了数论在求解不定方程、模线性方程和乘法逆元方面的应用。摘要长度:184字。 ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
  • Java 11相对于Java 8,OptaPlanner性能提升有多大?
    本文通过基准测试比较了Java 11和Java 8对OptaPlanner的性能提升。测试结果表明,在相同的硬件环境下,Java 11相对于Java 8在垃圾回收方面表现更好,从而提升了OptaPlanner的性能。 ... [详细]
author-avatar
捕鱼达人2602884285
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有