寻找预处理字符串功能的方法

 晴天逍遥 发布于 2023-02-13 18:49

对于机器学习问题,我为每个样本都有一个位置特征(美国的一个州),它看起来像这样:整个特征向量看起来像这样:

array(['oklahoma', 'florida', 'idaho', ..., 'pennsylvania', 'alabama',
   'washington'], dtype=object)

我不能直接用sklearn算法提供这个,因此我必须以某种方式将其转换为数字特征,但我不知道如何做到这一点.它们是转换这些字符串功能的最佳方法是什么?ASCII转换会起作用吗?

编辑:我希望我的每个州都有自己独特的数值.

1 个回答
  • 您可以参考标签预处理:

    from sklearn import preprocessing
    le = preprocessing.LabelEncoder()
    le.fit(['oklahoma', 'florida', 'idaho', 'pennsylvania', 'alabama',
         'washington'])
    le.classes_
    # array(['alabama', 'florida', 'idaho', 'oklahoma', 'pennsylvania',
    #         'washington'],
    #       dtype='|S12')
    le.transform(["oklahoma"])
    # array([3])
    

    2023-02-13 18:52 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有