热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Depth3featurealwaysequalsto0

Bug/FeatureRequestTitleWhenItrytocreatedepth3seedfeatureitalway


Bug/Feature Request Title

When I try to create depth 3 seed feature it always returns a column equal to 0 instead of expected values.

Bug/Feature Request Description

I built an example dataset described like this:

1
2
3
4
5
6
7
8
9
10
11
python

Entityset: None

  Entities:

    pers [Rows: 1, Columns: 4]

    cli [Rows: 29, Columns: 5]

    k [Rows: 43, Columns: 4]

    fin_exp [Rows: 43, Columns: 4]

  Relationships:

    cli.hid -> pers.hid

    k.id_k -> cli.id_k

    fin_exp.id_fin -> k.id_fin

When I try to calculate a seed feature of depth 3 like

1
2
3
python

ft.Feature(ft.Feature(ft.Feature(tset['fin_exp']['premium'], parent_entity = tset['k'], primitive = Sum()), parent_entity = tset['cli'], primitive = Sum()), parent_entity = tset['pers'], primitive = Sum())

ft.Feature(ft.Feature(ft.Feature(tset['fin_exp']['id_fin'], parent_entity = tset['k'], primitive = NumUnique()), parent_entity = tset['cli'], primitive = Sum()), parent_entity = tset['pers'], primitive = Sum())

it returns a column (one value in this case) fulls of zeroes instead of actual values. For comparison if I count on a duplicate

1
tset['k']['idf']

of index

1
tset['k']['id_fin']

for the parent entity

1
2
python

ft.Feature(ft.Feature(tset['k']['idf'], parent_entity = tset['cli'], primitive = NumUnique()), parent_entity = tset['pers'], primitive = Sum())

I get 43 - as expected since fin_exp and k have one-to-one relationship in the example.

Expected Output

1
2
3
python

ft.Feature(ft.Feature(ft.Feature(tset['fin_exp']['id_fin'], parent_entity = tset['k'], primitive = NumUnique()), parent_entity = tset['cli'], primitive = Sum()), parent_entity = tset['pers'], primitive = Sum())

ft.Feature(ft.Feature(tset['k']['idf'], parent_entity = tset['cli'], primitive = NumUnique()), parent_entity = tset['pers'], primitive = Sum())

should return the same value.

Output of
1
featuretools.show_info()

featuretools.show_info() still doesn't print any input. Branch is slightly behind master.

Featuretools version: 0.9.0
Featuretools installation directory: y:\git\featuretools\featuretools

SYSTEM INFO
-----------
python: 3.7.3.final.0
python-bits: 64
OS: Windows
OS-release: 2008ServerR2
machine: AMD64
processor: Intel64 Family 6 Model 45 Stepping 2, GenuineIntel
byteorder: little
LC_ALL: None
LANG: None
LOCALE: None.None

INSTALLED VERSIONS
------------------
numpy: 1.16.4
pandas: 0.24.2
tqdm: 4.32.2
toolz: 0.9.0
PyYAML: 5.1.1
cloudpickle: 1.2.1
future: 0.17.1
dask: 2.0.0
distributed: 2.0.1
psutil: 5.6.3
Click: 7.0
scikit-learn: 0.21.2
pip: 19.1.1
setuptools: 41.0.1

该提问来源于开源项目:alteryx/featuretools

I can confirm that the issue is fixed in




1
set-index-featureset-calculator

branch.


   



推荐阅读
  • 本文详细介绍了如何使用MySQL来显示SQL语句的执行时间,并通过MySQL Query Profiler获取CPU和内存使用量以及系统锁和表锁的时间。同时介绍了效能分析的三种方法:瓶颈分析、工作负载分析和基于比率的分析。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • http:my.oschina.netleejun2005blog136820刚看到群里又有同学在说HTTP协议下的Get请求参数长度是有大小限制的,最大不能超过XX ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 自动轮播,反转播放的ViewPagerAdapter的使用方法和效果展示
    本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter,并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]
  • 闭包一直是Java社区中争论不断的话题,很多语言都支持闭包这个语言特性,闭包定义了一个依赖于外部环境的自由变量的函数,这个函数能够访问外部环境的变量。本文以JavaScript的一个闭包为例,介绍了闭包的定义和特性。 ... [详细]
  • 本文介绍了在mac环境下使用nginx配置nodejs代理服务器的步骤,包括安装nginx、创建目录和文件、配置代理的域名和日志记录等。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • 本文介绍了如何使用C#制作Java+Mysql+Tomcat环境安装程序,实现一键式安装。通过将JDK、Mysql、Tomcat三者制作成一个安装包,解决了客户在安装软件时的复杂配置和繁琐问题,便于管理软件版本和系统集成。具体步骤包括配置JDK环境变量和安装Mysql服务,其中使用了MySQL Server 5.5社区版和my.ini文件。安装方法为通过命令行将目录转到mysql的bin目录下,执行mysqld --install MySQL5命令。 ... [详细]
  • 本文介绍了在Linux下安装和配置Kafka的方法,包括安装JDK、下载和解压Kafka、配置Kafka的参数,以及配置Kafka的日志目录、服务器IP和日志存放路径等。同时还提供了单机配置部署的方法和zookeeper地址和端口的配置。通过实操成功的案例,帮助读者快速完成Kafka的安装和配置。 ... [详细]
  • 本文介绍了使用cacti监控mssql 2005运行资源情况的操作步骤,包括安装必要的工具和驱动,测试mssql的连接,配置监控脚本等。通过php连接mssql来获取SQL 2005性能计算器的值,实现对mssql的监控。详细的操作步骤和代码请参考附件。 ... [详细]
  • 本文介绍了在CentOS上安装Python2.7.2的详细步骤,包括下载、解压、编译和安装等操作。同时提供了一些注意事项,以及测试安装是否成功的方法。 ... [详细]
  • IjustinheritedsomewebpageswhichusesMooTools.IneverusedMooTools.NowIneedtoaddsomef ... [详细]
author-avatar
berryhu
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有