热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python:用sklearn中的DecisionTreeClassifier,根据iris数据生成决策树并实现西瓜书决策树

需求包分析:关键词:sklearn、DecisionTreeClassifier、iris数据、决策树对应包:sklearn.tree

需求包分析:

关键词:sklearn、DecisionTreeClassifier、iris数据、决策树

对应包:sklearn.tree.DecisionTreeClassifier、sklearn.datasets.load_iris、matplotlib.pyplot

分析完毕,实现代码如下

import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn import treeiris = load_iris()
iris_tree = tree.DecisionTreeClassifier(criterion='entropy')
iris_tree = iris_tree.fit(iris.data,iris.target)
plt.figure(1)
tree.plot_tree(iris_tree)
plt.show()

运行结果:

在这里插入图片描述

思考

我们是否可以用上面的方法对其他数据集进行分析?

我们先将iris的文件导出,看看里面的格式

from sklearn.datasets import load_iriswith open("irisData.txt","w") as f:f.write(str(load_iris()))

得到结果:文件中为‘data’和’target’的两个数组

{'data': array([[5.1, 3.5, 1.4, 0.2],[4.9, 3. , 1.4, 0.2],[4.7, 3.2, 1.3, 0.2],[4.6, 3.1, 1.5, 0.2],[5. , 3.6, 1.4, 0.2],[5.4, 3.9, 1.7, 0.4],[4.6, 3.4, 1.4, 0.3]), 'target': array([0, 0, 0, 0, 0, 0, 0])
已删除多余部分,只保留说明性的前7个鸢尾花(iris)数据

所以要将西瓜树中所给的数据同样转变为‘data’和‘target’两个数组

分析完毕,代码如下:

将西瓜数据集转化为相应形式:

with open('walterMelonData.txt','r') as f:data = []for line in f.readlines():line = line.strip('\n') #用换行符作为行的识别符data.append(line.split(' ')) #行内数据用空格作为数据分割符data = np.array(data,dtype=float)watermelon_data = np.array(data[:,:8])watermelon_target = np.array(data[:,8])
print('数据集:',watermelon_data,'\n标签:',watermelon_target)

输出结果为:

在这里插入图片描述

得到结果以后,我们就可以直接带入到之前的那个代码中。即:

import matplotlib.pyplot as plt
from sklearn import tree
import numpy as npwith open('walterMelonData.txt','r') as f:data = []for line in f.readlines():line = line.strip('\n')data.append(line.split(' '))data = np.array(data,dtype=float)watermelon_data = np.array(data[:,:8])watermelon_target = np.array(data[:,8])watermelon_tree = tree.DecisionTreeClassifier(criterion='entropy')
watermelon_tree = watermelon_tree.fit(watermelon_data,watermelon_target)
plt.figure(1)
tree.plot_tree(watermelon_tree)
plt.show()

资源:西瓜数据集合

输出结果:

在这里插入图片描述

遇到的问题

二维数组切割的格式


推荐阅读
  • java drools5_Java Drools5.1 规则流基础【示例】(中)
    五、规则文件及规则流EduInfoRule.drl:packagemyrules;importsample.Employ;ruleBachelorruleflow-group ... [详细]
  • Linux重启网络命令实例及关机和重启示例教程
    本文介绍了Linux系统中重启网络命令的实例,以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法,以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 本文讨论了Kotlin中扩展函数的一些惯用用法以及其合理性。作者认为在某些情况下,定义扩展函数没有意义,但官方的编码约定支持这种方式。文章还介绍了在类之外定义扩展函数的具体用法,并讨论了避免使用扩展函数的边缘情况。作者提出了对于扩展函数的合理性的质疑,并给出了自己的反驳。最后,文章强调了在编写Kotlin代码时可以自由地使用扩展函数的重要性。 ... [详细]
  • 本文介绍了使用哈夫曼树实现文件压缩和解压的方法。首先对数据结构课程设计中的代码进行了分析,包括使用时间调用、常量定义和统计文件中各个字符时相关的结构体。然后讨论了哈夫曼树的实现原理和算法。最后介绍了文件压缩和解压的具体步骤,包括字符统计、构建哈夫曼树、生成编码表、编码和解码过程。通过实例演示了文件压缩和解压的效果。本文的内容对于理解哈夫曼树的实现原理和应用具有一定的参考价值。 ... [详细]
  • 开源Keras Faster RCNN模型介绍及代码结构解析
    本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]
  • 超级简单加解密工具的方案和功能
    本文介绍了一个超级简单的加解密工具的方案和功能。该工具可以读取文件头,并根据特定长度进行加密,加密后将加密部分写入源文件。同时,该工具也支持解密操作。加密和解密过程是可逆的。本文还提到了一些相关的功能和使用方法,并给出了Python代码示例。 ... [详细]
  • 1Lock与ReadWriteLock1.1LockpublicinterfaceLock{voidlock();voidlockInterruptibl ... [详细]
  • Html5-Canvas实现简易的抽奖转盘效果
    本文介绍了如何使用Html5和Canvas标签来实现简易的抽奖转盘效果,同时使用了jQueryRotate.js旋转插件。文章中给出了主要的html和css代码,并展示了实现的基本效果。 ... [详细]
  • 第四章高阶函数(参数传递、高阶函数、lambda表达式)(python进阶)的讲解和应用
    本文主要讲解了第四章高阶函数(参数传递、高阶函数、lambda表达式)的相关知识,包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念,并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说,本文将是一个不错的学习资料。 ... [详细]
  • 本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期,包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时,还介绍了一段使用正则表达式的代码,可以支持中文日期和一些特殊的时间识别,例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]
  • 欢乐的票圈重构之旅——RecyclerView的头尾布局增加
    项目重构的Git地址:https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集:http:www.jianshu.comno ... [详细]
  • HashMap的扩容知识详解
    本文详细介绍了HashMap的扩容知识,包括扩容的概述、扩容条件以及1.7版本中的扩容方法。通过学习本文,读者可以全面了解HashMap的扩容机制,提升对HashMap的理解和应用能力。 ... [详细]
author-avatar
潮人-小麦
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有