大熊猫：给定开始日期和结束日期，请为这之间的每一天添加一列，然后添加值？

作者：手机用户2602881417 | 来源：互联网 | 2023-10-09 19:41

这是我的数据dfpd.DataFrame([{start_date:'20191201',end_date:'20191205&

这是我的数据

df = pd.DataFrame([ {start_date: '2019/12/01',end_date: '2019/12/05',spend: 10000,campaign_id: 1} {start_date: '2019/12/05',end_date: '2019/12/09',spend: 50000,campaign_id: 2} {start_date: '2019/12/01',end_date: '',campaign_id: 3} {start_date: '2019/12/01',end_date: '2019/12/01',spend: 50,campaign_id: 4} ]);

自2019年12月1日起，我需要在每一行的每一行中添加一列，并计算该天该广告系列的支出，这是通过将广告系列的支出除以总天数得出的它很活跃。

因此，我将在12月1日至今天（12月10日）之间的每一天添加一列。对于第1行，12月1日至12月5日这5列的内容为2000，然后，对于12月5日至12月10日的6个列，其内容为零。

我知道熊猫是针对此类问题精心设计的，但我不知道从哪里开始！

对我来说，这似乎不是直接的任务。但是，如果尚未转换日期列，请先进行转换：

df["start_date"] = pd.to_datetime(df["start_date"]) df["end_date"] = pd.to_datetime(df["end_date"])

然后创建一个用于重采样的辅助函数：

def resampler(data,daterange): temp = (data.set_index('start_date').groupby('campaign_id') .apply(daterange) .drop("campaign_id",axis=1) .reset_index().rename(columns={"level_1":"start_date"})) return temp

现在是一个三步过程。首先根据每个组的end_date对数据进行重新采样：

df1 = resampler(df,lambda d: d.reindex(pd.date_range(min(d.index),max(d["end_date"]),freq="D")) if d["end_date"].notnull().all() else d) df1["spend"] = df1.groupby("campaign_id")["spend"].transform(lambda x: x.mean()/len(x))

计算出平均值之后，resample再次显示当前日期：

dates = pd.date_range(min(df["start_date"]),pd.Timestamp.today(),freq="D") df1 = resampler(df1,lambda d: d.reindex(dates))

最后转置您的数据框：

df1 = pd.concat([df1.drop("end_date",axis=1).set_index(["campaign_id","start_date"]).unstack(),df1.groupby("campaign_id")["end_date"].min()],axis=1) df1.columns = [*dates,"end_date"] print (df1) # 2019-12-01 00:00:00 2019-12-02 00:00:00 2019-12-03 00:00:00 2019-12-04 00:00:00 2019-12-05 00:00:00 2019-12-06 00:00:00 2019-12-07 00:00:00 2019-12-08 00:00:00 2019-12-09 00:00:00 2019-12-10 00:00:00 end_date campaign_id 1 2000.0 2000.0 2000.0 2000.0 2000.0 NaN NaN NaN NaN NaN 2019-12-05 2 NaN NaN NaN NaN 10000.0 10000.0 10000.0 10000.0 10000.0 NaN 2019-12-09 3 10000.0 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaT 4 50.0 NaN NaN NaN NaN NaN NaN NaN NaN NaN 2019-12-01

推荐阅读

io
【机器学习手册】日期和时区操作的重要性及应用

本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景，描述了学童们面对老先生的教导时的反应，以及上官如在这个过程中的表现。同时，文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后，文章强调了日期和时区操作在机器学习中的重要性，并指出了其在实际应用中的作用和意义。 ... [详细]

蜡笔小新 2023-12-12 17:40:14
io
如何用GStreamer删除H264格式的中间部分视频

本文讨论了如何使用GStreamer来删除H264格式视频文件中的中间部分，而不需要进行重编码。作者提出了使用gst_element_seek(...)函数来实现这个目标的思路，并提到遇到了一个解决不了的BUG。文章还列举了8个解决方案，希望能够得到更好的思路。 ... [详细]

蜡笔小新 2023-12-10 08:46:57
io
python 读文件显示在html中_如何从多个URL读取Python中的HTML文件？

我正在编写一个脚本，它将根据以下内容从基本HTML页面中提取数据：URL中的第一个参数在-90.0和90.0(含)之间浮动，第二个数字在- ... [详细]

蜡笔小新 2023-10-17 15:05:36
io
Python对Excel文件的读取方法及模块安装

本文介绍了Python对Excel文件的读取方法，包括模块的安装和使用。通过安装xlrd、xlwt、xlutils、pyExcelerator等模块，可以实现对Excel文件的读取和处理。具体的读取方法包括打开excel文件、抓取所有sheet的名称、定位到指定的表单等。本文提供了两种定位表单的方式，并给出了相应的代码示例。 ... [详细]

蜡笔小新 2023-12-14 19:49:05
io
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
io
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
io
Python爬虫技术基础篇面向对象高级编程（中）的多重继承

本文介绍了Python爬虫技术基础篇面向对象高级编程（中）中的多重继承概念。通过继承，子类可以扩展父类的功能。文章以动物类层次的设计为例，讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例，以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]

蜡笔小新 2023-12-12 16:19:02
io
基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本

文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]

蜡笔小新 2023-12-12 13:27:42
io
Python自动提取文本中的时间（包含中文日期）及特殊时间识别方法

本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期，包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时，还介绍了一段使用正则表达式的代码，可以支持中文日期和一些特殊的时间识别，例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]

蜡笔小新 2023-12-12 12:09:33
io
android studio生成jks,android studio生成 keystore 以及获取 SHA1值等

合并列值－合并为一列问题需求：createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]

蜡笔小新 2023-12-11 12:32:55
io
十大经典排序算法动图演示+Python实现

本文介绍了十大经典排序算法的原理、演示和Python实现。排序算法分为内部排序和外部排序，常见的内部排序算法有插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。文章还解释了时间复杂度和稳定性的概念，并提供了相关的名词解释。 ... [详细]

蜡笔小新 2023-12-10 19:28:59
php
Python使用Pillow包生成验证码图片的方法

本文介绍了使用Python中的Pillow包生成验证码图片的方法。通过随机生成数字和符号，并添加干扰象素，生成一幅验证码图片。需要配置好Python环境，并安装Pillow库。代码实现包括导入Pillow包和随机模块，定义随机生成字母、数字和字体颜色的函数。 ... [详细]

蜡笔小新 2023-12-10 16:51:25
io
如何使用readlink获取文件的完整路径？

本文介绍了使用readlink命令获取文件的完整路径的简单方法，并提供了一个示例命令来打印文件的完整路径。共有28种解决方案可供选择。 ... [详细]

蜡笔小新 2023-12-09 17:28:17
sum
利用PyTorch快速实现分类任务

关于如何快速定义自己的数据集，可以参考我的前一篇文章PyTorch中快速加载自定义数据（入门）_晨曦473的博客-CSDN博客刚开始学习P ... [详细]

蜡笔小新 2023-10-17 18:12:24
io
获取时间的函数js代码,js获取时区代码

本文目录一览：1、js获取服务器时间（动态）2 ... [详细]

蜡笔小新 2023-10-17 16:49:20

手机用户2602881417

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章