热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ImproveerrormessagewhenCategoricalvariablehasNaNs

BugDescriptionWhencategoricalvariablehas


Bug Description

When categorical variable has

1
NaN

s, ValueError with following traceback is shown:

In categorical columns, replacing

1
np.NaN

with string

1
NaN

helped to remove this error.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

in

      6     target_entity=MONTH_ENTITY_NAME,

      7     features_only=not RUN_DFS,

----> 8     **dfs_definition

      9 )

     10



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\featuretools\synthesis\dfs.py in dfs(entities, relationships, entityset, target_entity, cutoff_time, instance_ids, agg_primitives, trans_primitives, groupby_trans_primitives, allowed_paths, max_depth, ignore_entities, ignore_variables, seed_features, drop_contains, drop_exact, where_primitives, max_features, cutoff_time_in_index, save_progress, features_only, training_window, approximate, chunk_size, n_jobs, dask_kwargs, verbose, return_variable_types)

    233                                                   n_jobs=n_jobs,

    234                                                   dask_kwargs=dask_kwargs,

--> 235                                                   verbose=verbose)

    236     return feature_matrix, features



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\featuretools\computational_backends\calculate_feature_matrix.py in calculate_feature_matrix(features, entityset, cutoff_time, instance_ids, entities, relationships, cutoff_time_in_index, training_window, approximate, save_progress, verbose, chunk_size, n_jobs, dask_kwargs, profile)

    252                                                    target_time=target_time,

    253                                                    pass_columns=pass_columns,

--> 254                                                    dask_kwargs=dask_kwargs or {})

    255     else:

    256         feature_matrix = linear_calculate_chunks(chunks=chunks,



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\featuretools\computational_backends\calculate_feature_matrix.py in parallel_calculate_chunks(chunks, features, approximate, training_window, verbose, save_progress, entityset, n_jobs, no_unapproximated_aggs, cutoff_df_time_var, target_time, pass_columns, dask_kwargs)

    600             pbar = make_tqdm_iterator(total=len(_chunks), bar_format=pbar_str)

    601         for batch in iterator:

--> 602             results = client.gather(batch)

    603             for result in results:

    604                 feature_matrix.append(result)



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\distributed\client.py in gather(self, futures, errors, maxsize, direct, asynchronous)

   1654             return self.sync(self._gather, futures, errors=errors,

   1655                              direct=direct, local_worker=local_worker,

-> 1656                              asynchronous=asynchronous)

   1657

   1658     .coroutine



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\distributed\client.py in sync(self, func, *args, **kwargs)

    674             return future

    675         else:

--> 676             return sync(self.loop, func, *args, **kwargs)

    677

    678     def __repr__(self):



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\distributed\utils.py in sync(loop, func, *args, **kwargs)

    275             e.wait(10)

    276     if error[0]:

--> 277         six.reraise(*error[0])

    278     else:

    279         return result[0]



~\AppData\Roaming\Python\Python37\site-packages\six.py in reraise(tp, value, tb)

    691             if value.__traceback__ is not tb:

    692                 raise value.with_traceback(tb)

--> 693             raise value

    694         finally:

    695             value = None



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\distributed\utils.py in f()

    260             if timeout is not None:

    261                 future = gen.with_timeout(timedelta(seconds=timeout), future)

--> 262             result[0] = yield future

    263         except Exception as exc:

    264             error[0] = sys.exc_info()



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\tornado\gen.py in run(self)

    727

    728                     try:

--> 729                         value = future.result()

    730                     except Exception:

    731                         exc_info = sys.exc_info()



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\tornado\gen.py in run(self)

    734                     if exc_info is not None:

    735                         try:

--> 736                             yielded = self.gen.throw(*exc_info)  # type: ignore

    737                         finally:

    738                             # Break up a reference to itself



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\distributed\client.py in _gather(self, futures, errors, direct, local_worker)

   1495                             six.reraise(type(exception),

   1496                                         exception,

-> 1497                                         traceback)

   1498                     if errors == 'skip':

   1499                         bad_keys.add(key)



~\AppData\Roaming\Python\Python37\site-packages\six.py in reraise(tp, value, tb)

    690                 value = tp()

    691             if value.__traceback__ is not tb:

--> 692                 raise value.with_traceback(tb)

    693             raise value

    694         finally:



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\dask\compatibility.py in apply()

     91     def apply(func, args, kwargs=None):

     92         if kwargs:

---> 93             return func(*args, **kwargs)

     94         else:

     95             return func(*args)



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\featuretools\computational_backends\calculate_feature_matrix.py in calculate_chunk()

    349                                            ids,

    350                                            precalculated_features=precalculated_features,

--> 351                                            training_window=window)

    352

    353             id_name = _feature_matrix.index.name



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\featuretools\computational_backends\utils.py in wrapped()

     34         def wrapped(*args, **kwargs):

     35             if save_progress is None:

---> 36                 r = method(*args, **kwargs)

     37             else:

     38                 time = args[0].to_pydatetime()



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\featuretools\computational_backends\calculate_feature_matrix.py in calc_results()

    323                                                     precalculated_features=precalculated_features,

    324                                                     ignored=all_approx_feature_set,

--> 325                                                     profile=profile)

    326             return matrix

    327



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\featuretools\computational_backends\pandas_backend.py in calculate_all_features()

    195

    196                     handler = self._feature_type_handler(test_feature)

--> 197                     result_frame = handler(group, input_frames)

    198

    199                     output_frames_type = self.feature_tree.output_frames_type(test_feature)



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\featuretools\computational_backends\pandas_backend.py in _calculate_transform_features()

    321                 values = feature_func(*variable_data, time=self.time_last)

    322             else:

--> 323                 values = feature_func(*variable_data)

    324

    325             # if we don't get just the values, the assignment breaks when indexes don't match



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\featuretools\primitives\standard\binary_transform.py in equal_scalar()

    159         def equal_scalar(vals):

    160             # case to correct pandas type for comparison

--> 161             return pd.Series(vals).astype(pd.Series([self.value]).dtype) == self.value

    162         return equal_scalar

    163



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\pandas\core\generic.py in astype()

   5689             # else, only a single dtype is given

   5690             new_data = self._data.astype(dtype=dtype, copy=copy, errors=errors,

-> 5691                                          **kwargs)

   5692             return self._constructor(new_data).__finalize__(self)

   5693



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\pandas\core\internals\managers.py in astype()

    529

    530     def astype(self, dtype, **kwargs):

--> 531         return self.apply('astype', dtype=dtype, **kwargs)

    532

    533     def convert(self, **kwargs):



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\pandas\core\internals\managers.py in apply()

    393                                             copy=align_copy)

    394

--> 395             applied = getattr(b, f)(**kwargs)

    396             result_blocks = _extend_blocks(applied, result_blocks)

    397



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\pandas\core\internals\blocks.py in astype()

    532     def astype(self, dtype, copy=False, errors='raise', values=None, **kwargs):

    533         return self._astype(dtype, copy=copy, errors=errors, values=values,

--> 534                             **kwargs)

    535

    536     def _astype(self, dtype, copy=False, errors='raise', values=None,



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\pandas\core\internals\blocks.py in _astype()

    631

    632                     # _astype_nansafe works fine with 1-d only

--> 633                     values = astype_nansafe(values.ravel(), dtype, copy=True)

    634

    635                 # TODO(extension)



c:\users\jan.hynek\appdata\local\programs\python\python37-32\lib\site-packages\pandas\core\dtypes\cast.py in astype_nansafe()

    700     if copy or is_object_dtype(arr) or is_object_dtype(dtype):

    701         # Explicit copy, or required since NumPy can't view from / to object.

--> 702         return arr.astype(dtype, copy=True)

    703

    704     return arr.view(dtype)



ValueError: could not convert string to float: 'Sázava'


该提问来源于开源项目:FeatureLabs/featuretools

This should have been fixed by #504, closing





   



推荐阅读
  • python+selenium十:基于原生selenium的二次封装fromseleniumimportwebdriverfromselenium.webdriv ... [详细]
  • Python实现变声器功能(萝莉音御姐音)的方法及步骤
    本文介绍了使用Python实现变声器功能(萝莉音御姐音)的方法及步骤。首先登录百度AL开发平台,选择语音合成,创建应用并填写应用信息,获取Appid、API Key和Secret Key。然后安装pythonsdk,可以通过pip install baidu-aip或python setup.py install进行安装。最后,书写代码实现变声器功能,使用AipSpeech库进行语音合成,可以设置音量等参数。 ... [详细]
  • 本文整理了315道Python基础题目及答案,帮助读者检验学习成果。文章介绍了学习Python的途径、Python与其他编程语言的对比、解释型和编译型编程语言的简述、Python解释器的种类和特点、位和字节的关系、以及至少5个PEP8规范。对于想要检验自己学习成果的读者,这些题目将是一个不错的选择。请注意,答案在视频中,本文不提供答案。 ... [详细]
  • [翻译]PyCairo指南裁剪和masking
    裁剪和masking在PyCairo指南的这个部分,我么将讨论裁剪和masking操作。裁剪裁剪就是将图形的绘制限定在一定的区域内。这样做有一些效率的因素࿰ ... [详细]
  • 闭包一直是Java社区中争论不断的话题,很多语言都支持闭包这个语言特性,闭包定义了一个依赖于外部环境的自由变量的函数,这个函数能够访问外部环境的变量。本文以JavaScript的一个闭包为例,介绍了闭包的定义和特性。 ... [详细]
  • 本文介绍了iOS数据库Sqlite的SQL语句分类和常见约束关键字。SQL语句分为DDL、DML和DQL三种类型,其中DDL语句用于定义、删除和修改数据表,关键字包括create、drop和alter。常见约束关键字包括if not exists、if exists、primary key、autoincrement、not null和default。此外,还介绍了常见的数据库数据类型,包括integer、text和real。 ... [详细]
  • 本文介绍了Python爬虫技术基础篇面向对象高级编程(中)中的多重继承概念。通过继承,子类可以扩展父类的功能。文章以动物类层次的设计为例,讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例,以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]
  • 基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本
    文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]
  • Netty源代码分析服务器端启动ServerBootstrap初始化
    本文主要分析了Netty源代码中服务器端启动的过程,包括ServerBootstrap的初始化和相关参数的设置。通过分析NioEventLoopGroup、NioServerSocketChannel、ChannelOption.SO_BACKLOG等关键组件和选项的作用,深入理解Netty服务器端的启动过程。同时,还介绍了LoggingHandler的作用和使用方法,帮助读者更好地理解Netty源代码。 ... [详细]
  • 用Vue实现的Demo商品管理效果图及实现代码
    本文介绍了一个使用Vue实现的Demo商品管理的效果图及实现代码。 ... [详细]
  • 本文介绍了解决mysql 5.1启动问题的方法,通过修改my.ini文件中的相关配置,包括innodb_data_home_dir和skip-innodb等,可以解决启动问题。同时还介绍了如何调整内存池来存储metadata信息。 ... [详细]
  • 本文介绍了利用ARMA模型对平稳非白噪声序列进行建模的步骤及代码实现。首先对观察值序列进行样本自相关系数和样本偏自相关系数的计算,然后根据这些系数的性质选择适当的ARMA模型进行拟合,并估计模型中的位置参数。接着进行模型的有效性检验,如果不通过则重新选择模型再拟合,如果通过则进行模型优化。最后利用拟合模型预测序列的未来走势。文章还介绍了绘制时序图、平稳性检验、白噪声检验、确定ARMA阶数和预测未来走势的代码实现。 ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了源码分析--ConcurrentHashMap与HashTable(JDK1.8)相关的知识,希望对你有一定的参考价值。  Concu ... [详细]
  • 近期,某用户在重启RAC一个节点的数据库实例时,发现启动速度非常慢。同时业务部门反馈连接RAC存活节点的业务也受影响。通过对日志的分析, ... [详细]
  • 【爬虫】关于企业信用信息公示系统加速乐最新反爬虫机制
    ( ̄▽ ̄)~又得半夜修仙了,作为一个爬虫小白,花了3天时间写好的程序,才跑了一个月目标网站就更新了,是有点悲催,还是要只有一天的时间重构。升级后网站的层次结构并没有太多变化,表面上 ... [详细]
author-avatar
去奥迪店买本驰
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有