热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

如何提取数据框中另一个行中不存在的行

如何提取数据框中

您可以将merge(…,how =’left’,indicator = True)与query()方法一起使用:

In [38]: pd.merge(all_data, subset, how='left', indicator=True) \
.query("_merge == 'left_only'") \
.drop('_merge',1)
Out[38]:
AID VID Freq
0 00016A3E 0127C661 1
2 00016A3E 0C032814 1
3 00016A3E 0BF6C78D 1
4 00016A3E 0A79DFF1 1
5 00016A3E 07BD2FB2 1
6 00016A3E 0790E61B 1
8 00016A3E 073630B5 3
9 00016A3E 06613535 1
10 00016A3E 05F809AF 1
11 00016A3E 05C625FF 1
12 00016A3E 04220EA8 4
13 00016A3E 013A29E5 1
14 00016A3E 0761C98A 1
15 00016AE9 0A769475 16
16 00016AE9 0A7DED0A 2
17 00016AE9 0ABF60DF 9
18 00016AE9 0AE3F25A 2
20 00016AE9 0BD8975A 2
21 00016AE9 44DF880B 1
22 00016AE9 43F9E08E 2
23 00016AE9 44EA5E08 2
24 00016AE9 4539ED1E 16
25 00016AE9 8516B55A 4
26 00016AE9 0972AFF2 1
27 00016AE9 0C559B34 1
28 00016AE9 06B5C040 7

一步步:

In [39]: pd.merge(all_data, subset, how='left', indicator=True)
Out[39]:
AID VID Freq _merge
0 00016A3E 0127C661 1 left_only
1 00016A3E 0C05DA5D 2 both
2 00016A3E 0C032814 1 left_only
3 00016A3E 0BF6C78D 1 left_only
4 00016A3E 0A79DFF1 1 left_only
5 00016A3E 07BD2FB2 1 left_only
6 00016A3E 0790E61B 1 left_only
7 00016A3E 0C24ED25 3 both
8 00016A3E 073630B5 3 left_only
9 00016A3E 06613535 1 left_only
10 00016A3E 05F809AF 1 left_only
11 00016A3E 05C625FF 1 left_only
12 00016A3E 04220EA8 4 left_only
13 00016A3E 013A29E5 1 left_only
14 00016A3E 0761C98A 1 left_only
15 00016AE9 0A769475 16 left_only
16 00016AE9 0A7DED0A 2 left_only
17 00016AE9 0ABF60DF 9 left_only
18 00016AE9 0AE3F25A 2 left_only
19 00016AE9 0AEFE12F 5 both
20 00016AE9 0BD8975A 2 left_only
21 00016AE9 44DF880B 1 left_only
22 00016AE9 43F9E08E 2 left_only
23 00016AE9 44EA5E08 2 left_only
24 00016AE9 4539ED1E 16 left_only
25 00016AE9 8516B55A 4 left_only
26 00016AE9 0972AFF2 1 left_only
27 00016AE9 0C559B34 1 left_only
28 00016AE9 06B5C040 7 left_only
29 00016AE9 0B0426FA 1 both
In [40]: pd.merge(all_data, subset, how='left', indicator=True).query("_merge == 'left_only'")
Out[40]:
AID VID Freq _merge
0 00016A3E 0127C661 1 left_only
2 00016A3E 0C032814 1 left_only
3 00016A3E 0BF6C78D 1 left_only
4 00016A3E 0A79DFF1 1 left_only
5 00016A3E 07BD2FB2 1 left_only
6 00016A3E 0790E61B 1 left_only
8 00016A3E 073630B5 3 left_only
9 00016A3E 06613535 1 left_only
10 00016A3E 05F809AF 1 left_only
11 00016A3E 05C625FF 1 left_only
12 00016A3E 04220EA8 4 left_only
13 00016A3E 013A29E5 1 left_only
14 00016A3E 0761C98A 1 left_only
15 00016AE9 0A769475 16 left_only
16 00016AE9 0A7DED0A 2 left_only
17 00016AE9 0ABF60DF 9 left_only
18 00016AE9 0AE3F25A 2 left_only
20 00016AE9 0BD8975A 2 left_only
21 00016AE9 44DF880B 1 left_only
22 00016AE9 43F9E08E 2 left_only
23 00016AE9 44EA5E08 2 left_only
24 00016AE9 4539ED1E 16 left_only
25 00016AE9 8516B55A 4 left_only
26 00016AE9 0972AFF2 1 left_only
27 00016AE9 0C559B34 1 left_only
28 00016AE9 06B5C040 7 left_only





推荐阅读
  • 颜色迁移(reinhard VS welsh)
    不要谈什么天分,运气,你需要的是一个截稿日,以及一个不交稿就能打爆你狗头的人,然后你就会被自己的才华吓到。------ ... [详细]
  • 本文介绍了200个经典c语言源代码,包括函数的使用,如sqrt函数、clanguagefunct等。这些源代码可以帮助读者更好地理解c语言的编程方法,并提供了实际应用的示例。 ... [详细]
  • bartlett方差齐性检验_R笔记:方差齐性检验
    转自个人微信公众号【Memo_Cleon】的统计学习笔记:R笔记:方差齐性检验。正如我们在一文中的介绍 ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
  • 本文讨论了如何使用GStreamer来删除H264格式视频文件中的中间部分,而不需要进行重编码。作者提出了使用gst_element_seek(...)函数来实现这个目标的思路,并提到遇到了一个解决不了的BUG。文章还列举了8个解决方案,希望能够得到更好的思路。 ... [详细]
  • RMAN中的不完整恢复是指通过还原所有数据文件将整个数据库回退,然后执行不完全恢复的操作。不完整恢复的场景包括完整恢复不可行或故意要丢失数据。完整恢复需要备份后生成的所有归档日志和联机重做日志,而如果这些日志缺失或损坏,恢复将在该点停止。决定故意丢失数据是在用户错误发生后采取的行动,例如忘了where条件导致整个表受影响。对于已提交的事务来说,这样的更改是不可逆的。 ... [详细]
  • 基于移动平台的会展导游系统APP设计与实现的技术介绍与需求分析
    本文介绍了基于移动平台的会展导游系统APP的设计与实现过程。首先,对会展经济和移动互联网的概念进行了简要介绍,并阐述了将会展引入移动互联网的意义。接着,对基础技术进行了介绍,包括百度云开发环境、安卓系统和近场通讯技术。然后,进行了用户需求分析和系统需求分析,并提出了系统界面运行流畅和第三方授权等需求。最后,对系统的概要设计进行了详细阐述,包括系统前端设计和交互与原型设计。本文对基于移动平台的会展导游系统APP的设计与实现提供了技术支持和需求分析。 ... [详细]
  • 本文概述了JNI的原理以及常用方法。JNI提供了一种Java字节码调用C/C++的解决方案,但引用类型不能直接在Native层使用,需要进行类型转化。多维数组(包括二维数组)都是引用类型,需要使用jobjectArray类型来存取其值。此外,由于Java支持函数重载,根据函数名无法找到对应的JNI函数,因此介绍了JNI函数签名信息的解决方案。 ... [详细]
  • 本文介绍了关于Java异常的八大常见问题,包括异常管理的最佳做法、在try块中定义的变量不能用于catch或finally的原因以及为什么Double.parseDouble(null)和Integer.parseInt(null)会抛出不同的异常。同时指出这些问题是由于不同的开发人员开发所导致的,不值得过多思考。 ... [详细]
  • wordpress的内页悬浮选项卡功能预览及使用方法介绍
    本文介绍了wordpress的内页悬浮选项卡功能,包括功能预览和使用方法。用户可以自定义切换按钮,设置锚点信息区域,灵活多变且无需代码编辑。文章可以统一设置按钮,也可以独立设置单篇文章的按钮,滚动模式下按钮以滑动形式展示,具有条理性和锚点属性,有利于SEO。滚动效果增加了网站的互动性,让用户参与互动,同时完全兼容手机,使信息展示更清晰。 ... [详细]
  • Oracle 和 mysql的9点区别【MySQL】
    数据库|mysql教程oracle,Oracle,money,mysql,coun数据库-mysql教程1.组函数用法规则mysql中组函数在select语句中可以随意使用,但在o ... [详细]
  • 问题描述698.划为k个相等的子集解题思路首先,对数组按照从大到小排序,相比从小到大排序,能避免[1,1,2,2]这样的数组的误判;利用used[i]数组避免重复使用同一个元素,如 ... [详细]
  • 【精读】Numpy详解
    (给机器学习算法与Python学习加星标,提升AI技能)Numpy是一个Python库模块,在Python编程中用于科学计算 ... [详细]
  • Givenasetofdistinctintegers,nums,returnallpossiblesubsets.Note:Thesolutionsetmustnotcontai ... [详细]
  • Whileponderingonthecountingmeasurerecently,Iconsideredthefollowing:在考虑最近的计票措施时,我考虑了以下几点: ... [详细]
author-avatar
爆米花来爆料V
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有