热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Depth3featurealwaysequalsto0

Bug/FeatureRequestTitleWhenItrytocreatedepth3seedfeatureitalway


Bug/Feature Request Title

When I try to create depth 3 seed feature it always returns a column equal to 0 instead of expected values.

Bug/Feature Request Description

I built an example dataset described like this:

1
2
3
4
5
6
7
8
9
10
11
python

Entityset: None

  Entities:

    pers [Rows: 1, Columns: 4]

    cli [Rows: 29, Columns: 5]

    k [Rows: 43, Columns: 4]

    fin_exp [Rows: 43, Columns: 4]

  Relationships:

    cli.hid -> pers.hid

    k.id_k -> cli.id_k

    fin_exp.id_fin -> k.id_fin

When I try to calculate a seed feature of depth 3 like

1
2
3
python

ft.Feature(ft.Feature(ft.Feature(tset['fin_exp']['premium'], parent_entity = tset['k'], primitive = Sum()), parent_entity = tset['cli'], primitive = Sum()), parent_entity = tset['pers'], primitive = Sum())

ft.Feature(ft.Feature(ft.Feature(tset['fin_exp']['id_fin'], parent_entity = tset['k'], primitive = NumUnique()), parent_entity = tset['cli'], primitive = Sum()), parent_entity = tset['pers'], primitive = Sum())

it returns a column (one value in this case) fulls of zeroes instead of actual values. For comparison if I count on a duplicate

1
tset['k']['idf']

of index

1
tset['k']['id_fin']

for the parent entity

1
2
python

ft.Feature(ft.Feature(tset['k']['idf'], parent_entity = tset['cli'], primitive = NumUnique()), parent_entity = tset['pers'], primitive = Sum())

I get 43 - as expected since fin_exp and k have one-to-one relationship in the example.

Expected Output

1
2
3
python

ft.Feature(ft.Feature(ft.Feature(tset['fin_exp']['id_fin'], parent_entity = tset['k'], primitive = NumUnique()), parent_entity = tset['cli'], primitive = Sum()), parent_entity = tset['pers'], primitive = Sum())

ft.Feature(ft.Feature(tset['k']['idf'], parent_entity = tset['cli'], primitive = NumUnique()), parent_entity = tset['pers'], primitive = Sum())

should return the same value.

Output of
1
featuretools.show_info()

featuretools.show_info() still doesn't print any input. Branch is slightly behind master.

Featuretools version: 0.9.0
Featuretools installation directory: y:\git\featuretools\featuretools

SYSTEM INFO
-----------
python: 3.7.3.final.0
python-bits: 64
OS: Windows
OS-release: 2008ServerR2
machine: AMD64
processor: Intel64 Family 6 Model 45 Stepping 2, GenuineIntel
byteorder: little
LC_ALL: None
LANG: None
LOCALE: None.None

INSTALLED VERSIONS
------------------
numpy: 1.16.4
pandas: 0.24.2
tqdm: 4.32.2
toolz: 0.9.0
PyYAML: 5.1.1
cloudpickle: 1.2.1
future: 0.17.1
dask: 2.0.0
distributed: 2.0.1
psutil: 5.6.3
Click: 7.0
scikit-learn: 0.21.2
pip: 19.1.1
setuptools: 41.0.1

该提问来源于开源项目:alteryx/featuretools

I can confirm that the issue is fixed in




1
set-index-featureset-calculator

branch.


   



推荐阅读
  • 基于Socket的多个客户端之间的聊天功能实现方法
    本文介绍了基于Socket的多个客户端之间实现聊天功能的方法,包括服务器端的实现和客户端的实现。服务器端通过每个用户的输出流向特定用户发送消息,而客户端通过输入流接收消息。同时,还介绍了相关的实体类和Socket的基本概念。 ... [详细]
  • 本文详细介绍了如何使用MySQL来显示SQL语句的执行时间,并通过MySQL Query Profiler获取CPU和内存使用量以及系统锁和表锁的时间。同时介绍了效能分析的三种方法:瓶颈分析、工作负载分析和基于比率的分析。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • http:my.oschina.netleejun2005blog136820刚看到群里又有同学在说HTTP协议下的Get请求参数长度是有大小限制的,最大不能超过XX ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • 本文介绍了Swing组件的用法,重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联,可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法,并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]
  • 欢乐的票圈重构之旅——RecyclerView的头尾布局增加
    项目重构的Git地址:https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集:http:www.jianshu.comno ... [详细]
  • Android系统源码分析Zygote和SystemServer启动过程详解
    本文详细解析了Android系统源码中Zygote和SystemServer的启动过程。首先介绍了系统framework层启动的内容,帮助理解四大组件的启动和管理过程。接着介绍了AMS、PMS等系统服务的作用和调用方式。然后详细分析了Zygote的启动过程,解释了Zygote在Android启动过程中的决定作用。最后通过时序图展示了整个过程。 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • 自动轮播,反转播放的ViewPagerAdapter的使用方法和效果展示
    本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter,并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]
  • 本文讨论了如何使用IF函数从基于有限输入列表的有限输出列表中获取输出,并提出了是否有更快/更有效的执行代码的方法。作者希望了解是否有办法缩短代码,并从自我开发的角度来看是否有更好的方法。提供的代码可以按原样工作,但作者想知道是否有更好的方法来执行这样的任务。 ... [详细]
  • Imtryingtofigureoutawaytogeneratetorrentfilesfromabucket,usingtheAWSSDKforGo.我正 ... [详细]
  • 先看官方文档TheJavaTutorialshavebeenwrittenforJDK8.Examplesandpracticesdescribedinthispagedontta ... [详细]
  • JDK源码学习之HashTable(附带面试题)的学习笔记
    本文介绍了JDK源码学习之HashTable(附带面试题)的学习笔记,包括HashTable的定义、数据类型、与HashMap的关系和区别。文章提供了干货,并附带了其他相关主题的学习笔记。 ... [详细]
  • 本文讨论了如何在codeigniter中识别来自angularjs的请求,并提供了两种方法的代码示例。作者尝试了$this->input->is_ajax_request()和自定义函数is_ajax(),但都没有成功。最后,作者展示了一个ajax请求的示例代码。 ... [详细]
author-avatar
berryhu
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有