热门标签 | HotTags
当前位置:  开发笔记 > 开放平台 > 正文

数据揭秘:中国姓氏排行榜

最近不知道哪个朋友(是的,我的确不知道)搞到了一组脱敏后的天朝公民个人数据,覆盖1000多万人,大概占全国人口

最近不知道哪个朋友(是的,我的确不知道)搞到了一组脱敏后的天朝公民个人数据,覆盖1000多万人,大概占全国人口的1%,信息包括姓氏、年龄、籍贯城市、现居城市等。朋友让我用这组数据随便做点啥。


这组数据如此牛逼,可以做的东西太多啦。但是,吸取了前两次文章被下架的教训,我决定做一个不那么敏感的话题。就做 “东半球第二有趣的中国姓氏排行榜”吧!


既然是“数据团”出品的姓氏排行榜,必然不能数数人头就敷衍了事。事实上,我为这个排行榜设计了丰富的内容:普遍指数、抱团指数、奔波指数、装逼指数、风雅指数等。


下面就开始对这个排行榜进行阐释吧!(具体排名见文章末尾)


1

普遍指数


普遍指数=姓氏人口数量


毫无悬念,“王”姓以占据中国人口8.1%的比例、接近1亿的人口总数,夺得了中国第一大姓、地球第一大姓、宇宙第一大姓的桂冠。


恭喜隔壁老王!


那么,老王们都在哪里呢?


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


看起来,隔壁老王虽然说不上无处不在,但也是蔚为壮观啊!


除了老王,老张、老李也表现不俗,分获宇宙第二、第三大姓的荣誉。这三大姓加起来,占据中国总人口的22%(由于我们掌握的数据不是完全的随机抽样,各个姓氏的排名与比例可能与其它统计结果略有不同)。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


总的来说,“王张李刘陈杨赵周吴徐”10大姓占据了中国总人口的43%;20大姓占据56%,而前100的大姓占据了88%!


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


但是,别看这些大姓多么牛逼,其实都发源于极少数的几个姓:姬、嬴、姜、妫等。其中,最为古老的可能就是“姬”了——“姬”传说是黄帝之姓、周朝国姓,并且是10大姓中7个姓的起源。千年过去,姬姓后嗣多已改为他姓,开枝散叶。而还保留着这个古老姓氏的人口,也仍然栖息在古老中华文明的发源地——河南。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


从姬姓的例子中我们看到,一些较小的姓氏在空间上的分布是高度集中的。这可能是因为较小姓氏的发源地相对单一吧。


为了探究姓氏的空间集聚问题,我们又设计了第二个指数:


2

抱团指数


抱团指数=各姓氏在各省分布的基尼系数。


研究结果表明,抱团指数最高、也就是空间集聚度最高的三个姓氏分别为:覃、麦、朴,三姓的基尼系数都在0.82以上,而且三个姓都是相对较小的姓。


先来看覃(qin,第二声):“覃”的本意为有盖的酒坛,最早的“覃”人以酿酒和制作酒具形成氏族。先秦时期,覃姓主要在河南活动,后来主力迁入南方,吸收了南方的众多外来血缘,并分化出谭、潭、镡(tan)、瞫(shen,第三声)等多个姓。现今,覃姓主要分布在广西、广东、湖南、湖北。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


麦姓,起源于春秋时期的麦丘(今山东商河西北),由齐恒公赐姓。麦姓南迁以后,出现在傈傈族、回族、布依族、瑶族、黎族等少数民族中。80%的麦姓人口都分布在广东。


但是,如果我们仔细看的话,会发现除了广东,麦姓在北京和上海也有两片相对集中的区域,其他区域则是一片漆黑。这个专注北上广的麦姓真是傲娇啊。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


朴的本意为树皮,也是一个小姓,但大多数读者都能正确地读出piao(第二声)而不是pu,这应该归功于“宇宙第一大国”的韩国吧。事实上,从空间分布来看,朴也是典型的北方姓氏,也主要分布在宇宙第一大国的辐射地:东北三省。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


如果说小姓比较容易呈现出明显的聚集趋势,那么人数众多的大姓是否都是雨露均沾、均匀分布的呢?


在top20的大姓中,绝大多数姓氏的基尼系数都在0.35-0.45范围内,但有一个姓很特殊,其基尼系数高达0.63—— “林”


我们来看一下林姓的空间分布:沿着福建、广东沿海,形成了一条非常明显的狭窄带状区域。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


尽管福威镖局在接班人问题上出现了一些技术障碍,但总体来说,林姓族人仍然坚守故土,并且在海峡两岸繁衍出了一系列娱乐圈明星,比如:林志玲、林心如、林志颖、林徽因……


然而,并不是每个氏族都像“姬”“林”那样安土重迁,可能也有一些特别愿意奔波、愿意去远处寻找梦想的。于是,我们又设计了第三个指数:


3

奔波指数


奔波指数=姓氏人均迁徙距离。迁徙距离为户籍地所在地级市与现居住地所在地级市的距离。


在喜欢奔波的姓氏中,首屈一指的就是——,人均迁徙距离达到900km。嗯,怎么又是朴?


总的来说,作为北方民族的朴姓非常喜欢南迁。对朴姓而言,最受欢迎的目的地有两个:山东和广东。这两个目的地,一个是北部地区的最南端,一个是天朝的最南端。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


奔波指数第二高的是“廉”姓,人均迁徙距离为600km。


廉姓主要分布于河南、山东、陕西等省,对外迁徙的目的地并没有明显偏好。但如果我们把廉姓的迁徙路径与其它姓氏做比较,相较于其它姓氏向经济发达地区聚集的趋势,廉姓似乎对新疆、云南、广西等西部地区等兴趣要更强一些。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


在20大姓中,奔波指数最高的是“何”,人均迁徙距离在400km左右。


何姓主要分布在四川、广东两省。但从迁徙图上来看,大概是四川太过“安逸”,何姓族人较少从四川迁出;而广东和长三角地区的何姓则活跃得多。


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


以上涉及到的姓氏,廉、朴、覃、麦等,都是一些自带逼格的小姓。似乎在各种排行中,大姓的特点都并不突出。这也难怪,大姓人多,形形色色的人都有,总体来看就比较平均了。


但是,如果已经进入到大姓行列,有没有办法提高自己或者是子女名字的逼格呢?当然姓是不能随便改的,我们就只能在名字上动脑筋了。于是,我们设计了第四个指数:


4

装逼指数


装逼指数=名字长度在4字或以上的人口数量占该姓氏人口数量的比例。


严格来说,装逼指数最高的其实是“欧阳”和“诸葛”。但考虑到复姓和少数民族姓氏的逼格并不是装出来的,我们只好排除掉这些本来就很有逼格的姓氏,只看单字大姓TOP20的装逼情况:


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


显然,“马”姓的装逼指数甩第二名的“高”和“周”一大截,这大概归功于马姓有天然的装逼优势。举个栗子:如果某国产神剧女主角名字改为“高尔泰•若曦”或者“周尔泰•若曦”,那么男主角还演得下去吗?


然而,名字长虽然增加逼格,却会给实际生活增加一些困扰。你能想象“璃莹殇•安洁莉娜•樱雪羽晗灵•血丽魑•魅•J•Q•安塔利亚•伤梦薰魅•海瑟薇•蔷薇玫瑰泪•羽灵•邪儿•凡多姆海威恩•夏影•琉璃舞•雅•蕾玥瑷雅•曦梦月•玥蓝•岚樱”被罚抄名字时的心情吗?


因此,想要彰显名字的独特,还可以采用另一种方式:采用生僻字或不常见的汉字组合。我们姑且将此类名字形容为“风雅”。


5

风雅指数


风雅指数=名字中不包括“取名用字频率TOP1000”的人数占该姓氏总人数的比例。


风雅指数最高的10个姓为:


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


的确,“程”姓有不少非常风雅的名字:程灵素、程蝶衣。但由于拥有这些名字的主人往往都很难坚持到故事结尾还不领便当,因此一念出来,总会带着淡淡的忧伤。


为了冲淡这种淡淡的忧伤,我们最后来看看能撑到最后一集的普通人都是怎么取名的呢?


 “取名常用字TOP100”请看下表:


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


好了,就这样吧。请转头看看你身边的朋友同学同事或者经常给你送快递的快递员。hi,小华、小伟、小文、小明、小军,你们还好吗?


附:姓氏排行TOP100

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1



原文发布时间为:2017-05-09 

本文作者:周宁奕、团支书

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号




推荐阅读
  • 【Windows】实现微信双开或多开的方法及步骤详解
    本文介绍了在Windows系统下实现微信双开或多开的方法,通过安装微信电脑版、复制微信程序启动路径、修改文本文件为bat文件等步骤,实现同时登录两个或多个微信的效果。相比于使用虚拟机的方法,本方法更简单易行,适用于任何电脑,并且不会消耗过多系统资源。详细步骤和原理解释请参考本文内容。 ... [详细]
  • 如何基于ggplot2构建相关系数矩阵热图以及一个友情故事
    本文介绍了如何在rstudio中安装ggplot2,并使用ggplot2构建相关系数矩阵热图。同时,通过一个友情故事,讲述了真爱难觅的故事背后的数据量化和皮尔逊相关系数的概念。故事中的小伙伴们在本科时参加各种考试,其中有些沉迷网络游戏,有些热爱体育,通过他们的故事,展示了不同兴趣和特长对学习和成绩的影响。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • 智能消息服务数字短信使用FAQ
    本文介绍了智能消息服务数字短信的开通流程和操作步骤,包括开通数字短信的路径、申请流程、控制台操作以及API接口对接模式。同时还介绍了数字短信模板的创建规则和要求,包括审核状态的说明和建议。 ... [详细]
  • 本文介绍了前端人员必须知道的三个问题,即前端都做哪些事、前端都需要哪些技术,以及前端的发展阶段。初级阶段包括HTML、CSS、JavaScript和jQuery的基础知识。进阶阶段涵盖了面向对象编程、响应式设计、Ajax、HTML5等新兴技术。高级阶段包括架构基础、模块化开发、预编译和前沿规范等内容。此外,还介绍了一些后端服务,如Node.js。 ... [详细]
  • 微信开放外链的第二阶段:腾讯和阿里巴巴的博弈
    2021年11月30日,微信开始进行“开放外链”的第二阶段,允许在微信个人会话中打开外部链接和在微信群中打开电商链接。虽然这是腾讯和阿里巴巴都能接受的阶段性结果,但双方都不会太满意。接下来几个月,腾讯和阿里将展开复杂的博弈,我们作为外人很难看清全过程。工信部从未要求腾讯无条件开放微信API,本次开放的也只是普通的HTTP链接。 ... [详细]
  • 小程序获取用户信息按钮返回中文地址
    1.我是根据官方文档中描述去写的按钮 可以看到button中加了zh_CNopen-typegetUserInfobindgetuserinfogetU ... [详细]
  • 微信朋友圈屏蔽设置教程,轻松屏蔽无关信息
    自从微信朋友圈越来越受欢迎,很多人想知道如何屏蔽一些不想看的朋友圈信息。本文提供了屏蔽设置教程,通过点击「我」-「相册」-「…」选项 -「消息列表」,左滑即可选择「不再通知」和「删除」某条朋友圈评论或点赞。想重新接收信息时,只需左滑即可。通过这些简单操作,您可以轻松屏蔽无关信息。 ... [详细]
  • 2022年的风口:你看不起的行业,真的很挣钱!
    本文介绍了2022年的风口,探讨了一份稳定的副业收入对于普通人增加收入的重要性,以及如何抓住风口来实现赚钱的目标。文章指出,拼命工作并不一定能让人有钱,而是需要顺应时代的方向。 ... [详细]
  • 小程序自动授权和手动接入的方式及操作步骤
    本文介绍了小程序支持的两种接入方式:自动授权和手动接入,并详细说明了它们的操作步骤。同时还介绍了如何在两种方式之间切换,以及手动接入后如何下载代码包和提交审核。 ... [详细]
  • 华为鸿蒙系统官网2.0报名方法及适用设备
    本文介绍了华为鸿蒙系统官网2.0报名的适用设备、报名方法以及三种方式,包括在应用商店下载开发者联盟app、在官网中进行报名、在微信公众号中申请体验HarmonyOS 2.0 手机开发者Beta版本。同时提醒错过测试机会的用户可以等待后续的正式版发布。 ... [详细]
  • 本文讨论了在微信浏览器中无法输入的问题,并提出了可能的原因。微信更新可能导致此问题的出现,用户可以尝试清除缓存或重新安装微信浏览器来解决此问题。 ... [详细]
  • 本文介绍了小程序商城引进流量的优化策略与方法。首先,通过附近小程序功能可以增加周围门店的方位并展示,吸引附近用户。其次,利用微信群聊功能,将小程序分享到多个微信群聊中,扩大影响力。最后,通过设置一些固定的活动机制,打造仪式感来吸引用户。这些方法能够有效提升小程序商城的流量,增加用户数量。 ... [详细]
  • 从高级程序员到CTO的4次能力跃迁!如何选择适合的技术负责人?
    本文讲解了从高级程序员到CTO的4次能力跃迁,以及如何选择适合的技术负责人。在初创期、发展期、成熟期的每个阶段,创业公司需要不同级别的技术负责人来实现复杂功能、解决技术难题、提高交付效率和质量。高级程序员的职责是实现复杂功能、编写核心代码、处理线上bug、解决技术难题。而技术经理则需要提高交付效率和质量。 ... [详细]
  • IT联合协会创始人分享的学习、创业和人生感悟
    本文分享了IT联合协会创始人的学习、创业和人生感悟,包括创办协会的经历、参与的比赛和活动、所关注的领域以及一些高效技巧。创始人强调了大学和工作前几年的学习资源的重要性,以及沉淀个人学习、生活和灵感资源对于大学和职场能力的影响。他还分享了自己关注的领域,包括软件开发和产品经理相关的专业方向。文章最后,他表达了对未来的期望和目标,并邀请有缘人一起交流。 ... [详细]
author-avatar
black李曼_827
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有