热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python,如何将此公式应用于数据库中的每一行,以便每一行给出不同的值,而不是每年给出相同的值

这是我的代码。对于2001、2002、2003等,它只返回一个值。我宁愿返回不同的值。轴-

这是我的代码。对于2001、2002、2003等,它只返回一个值。我宁愿返回不同的值。轴-1是否可以工作,如果可以,我应该将其放在哪里?

# Define a function to map the values
def set_value(row_number,assigned_value):
return assigned_value[row_number]
#Create the dictionary
year_dictiOnary={'2001' : np.random.randint(1,202335),'2002' : np.random.randint(1,188846),'2003' : np.random.randint(1,175357),"2004" : np.random.randint(1,161868),"2005" : np.random.randint(1,148379),"2006": np.random.randint(1,134890),"2007" : np.random.randint(1,121401),"2008" : np.random.randint(1,107912),"2009" :np.random.randint(1,94423),"2010" :np.random.randint(1,80934),"2011" :np.random.randint(1,67445),"2012" :np.random.randint(1,53956),"2013" :np.random.randint(1,40467),"2014" :np.random.randint(1,26978),"2015" :np.random.randint(1,13489)}
# Add a new column named 'mileage'
df5['mileage'] = df5['year'].apply(set_value,args =(year_dictionary,))

下面是创建df5示例的代码:

df5 = pd.DataFrame(columns=["year","fuel","status","sex","licence_type","mileage"])
# Populate the data with the number of cars per year.
df5['year'] = np.random.choice(["2001","2002","2003","2004","2005","2006","2007","2008","2009",2010,2011,2012,2013,2014,2015],p=[0.004,0.02,0.044,0.087,0.149,0.187,0.221,0.091,0.012,0.031,0.009,0.036,0.013,0.083,0.013],size=(100))
# Populate the Fuel column with petrol and diesel
df5['fuel'] = np.random.choice(['petrol','diesel'],100,p=[0.24,0.76])
# Populate the status column
df5['status'] = np.random.choice(["pass","fail","incomplete"],p=[0.36,0.63,0.01])
# Populate the sex column
df5['sex'] = np.random.choice(['male','female'],p=[0.53,0.47])
# Populate licence_type column
df5['licence_type'] = np.random.choice(["full","learner"],p=[0.92,0.08])
print (df5)


将您的year_dictionary更改为

year_dictiOnary={'2001' : 202335,'2002' : 188846,'2003' : 175357,"2004" : 161868,"2005" : 148379,"2006": 134890,"2007" : 121401,"2008" : 107912,"2009" :94423,"2010" :80934,"2011" :67445,"2012" :53956,"2013" :40467,"2014" :26978,"2015" :13489}

和set_value函数用于

def set_value(row_number,assigned_value):
return np.random.randint(1,assigned_value[row_number])

,

当您声明字典时,它会被声明一次(这意味着随机整数在声明阶段曾经被使用过,之后它们将不会改变)。因此,即使您为特定键(例如:“ 2001”)调用函数,它也会返回与实例化过程中随机生成的值相同的值。

因此,每次需要新随机生成的字典时,都必须更新值。


推荐阅读
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 闭包一直是Java社区中争论不断的话题,很多语言都支持闭包这个语言特性,闭包定义了一个依赖于外部环境的自由变量的函数,这个函数能够访问外部环境的变量。本文以JavaScript的一个闭包为例,介绍了闭包的定义和特性。 ... [详细]
  • 本文讨论了在openwrt-17.01版本中,mt7628设备上初始化启动时eth0的mac地址总是随机生成的问题。每次随机生成的eth0的mac地址都会写到/sys/class/net/eth0/address目录下,而openwrt-17.01原版的SDK会根据随机生成的eth0的mac地址再生成eth0.1、eth0.2等,生成后的mac地址会保存在/etc/config/network下。 ... [详细]
  • Givenasinglylinkedlist,returnarandomnode'svaluefromthelinkedlist.Eachnodemusthavethe s ... [详细]
  • 上图是InnoDB存储引擎的结构。1、缓冲池InnoDB存储引擎是基于磁盘存储的,并将其中的记录按照页的方式进行管理。因此可以看作是基于磁盘的数据库系统。在数据库系统中,由于CPU速度 ... [详细]
  • 开源Keras Faster RCNN模型介绍及代码结构解析
    本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • Java序列化对象传给PHP的方法及原理解析
    本文介绍了Java序列化对象传给PHP的方法及原理,包括Java对象传递的方式、序列化的方式、PHP中的序列化用法介绍、Java是否能反序列化PHP的数据、Java序列化的原理以及解决Java序列化中的问题。同时还解释了序列化的概念和作用,以及代码执行序列化所需要的权限。最后指出,序列化会将对象实例的所有字段都进行序列化,使得数据能够被表示为实例的序列化数据,但只有能够解释该格式的代码才能够确定数据的内容。 ... [详细]
  • HDU 2372 El Dorado(DP)的最长上升子序列长度求解方法
    本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法,通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]
  • 本文介绍了C#中数据集DataSet对象的使用及相关方法详解,包括DataSet对象的概述、与数据关系对象的互联、Rows集合和Columns集合的组成,以及DataSet对象常用的方法之一——Merge方法的使用。通过本文的阅读,读者可以了解到DataSet对象在C#中的重要性和使用方法。 ... [详细]
  • 本文介绍了OC学习笔记中的@property和@synthesize,包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本文介绍了PE文件结构中的导出表的解析方法,包括获取区段头表、遍历查找所在的区段等步骤。通过该方法可以准确地解析PE文件中的导出表信息。 ... [详细]
author-avatar
kingseao
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有