热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python教程分享Python实现xml格式转txt格式的示例代码

1、前言最近学习yolov5是遇见了个问题,找的数据集全是xml文件,voc的标注是xml格式的,而yolo是.txt格式,那么问题就来了,手动提取肯定是不可能的,那只能借用程序解

1、前言

最近学习yolo v5是遇见了个问题,找的数据集全是xml文件,voc 的标注是 xml 格式的,而yolo是.txt格式,那么问题就来了,手动提取肯定是不可能的,那只能借用程序解决咯。

2、分析xml、txt数据

这是xml树形结构

Python实现xml格式转txt格式的示例代码

这是txt格式

Python实现xml格式转txt格式的示例代码

总结:

1.提取object->name、bndbox->xmin,ymin,xmax,ymin

2.格式转化需要用公式转换

yolo数据集txt格式:

x_center :归一化后的中心点x坐标

y_center : 归一化后的中心点y坐标

w:归一化后的目标框宽度

h: 归一化后的目标况高度

(此处归一化指的是除以图片宽和高)

voc数据集xml格式

Python实现xml格式转txt格式的示例代码

yolo的四个数据 xml->txt公式
x_center ((x_min+x_max)/2-1)/w_image
y_center ((y_min+y_max)/2-1)/h_image
w (x_max-x_min)/w_image
h (y_max-y_min)/h_image

3、转换过程

定义两个文件夹,train放xml数据, labels放txt数据。

Python实现xml格式转txt格式的示例代码

代码解析:

import os  import xml.etree.elementtree as et  import io  find_path = './train/'    #xml所在的文件  savepath='./labels/'   #保存文件    class voc_yolo(object):      def __init__(self, find_path):          self.find_path = find_path      def make_txt(self, outfile):          out = open(outfile,'w')           print("创建成功:{}".format(outfile))          return out      def work(self, count):      #找到文件路径          for root, dirs, files in os.walk(self.find_path):          #找到文件目录中每一个xml文件              for file in files:              #记录处理过的文件                  count += 1                  #输入、输出文件定义                  input_file = find_path + file                  outfile = savepath+file[:-4]+'.txt'                  #新建txt文件,确保文件正常保存                  out = self.make_txt(outfile)                  #分析xml树,取出w_image、h_image                  tree=et.parse(input_file)                  root=tree.getroot()                  size=root.find('size')                  w_image=float(size.find('width').text)                  h_image=float(size.find('height').text)                  #继续提取有效信息来计算txt中的四个数据                  for obj in root.iter('object'):                  #将类型提取出来,不同目标类型不同,python教程分享Python实现xml格式转txt格式的示例代码仅有一个类别->0                      classname=obj.find('name').text                      cls_id = classname                      xmlbox=obj.find('bndbox')                      x_min=float(xmlbox.find('xmin').text)                      x_max=float(xmlbox.find('xmax').text)                      y_min=float(xmlbox.find('ymin').text)                      y_max=float(xmlbox.find('ymax').text)                      #计算公式                      x_center=((x_min+x_max)/2-1)/w_image                      y_center=((y_min+y_max)/2-1)/h_image                      w=(x_max-x_min)/w_image                      h=(y_max-y_min)/h_image                      #文件写入                      out.write(str(cls_id)+" "+str(x_center)+" "+str(y_center)+" "+str(w)+" "+str(h)+'n')                  out.close()          return count  if __name__ == "__main__":      data = voc_yolo(find_path)      number = data.work(0)      print(number)

4、最后结果对比

创建成功

Python实现xml格式转txt格式的示例代码

与真实数据对比误差很小

Python实现xml格式转txt格式的示例代码

到此这篇关于python实现xml格式转txt格式的示例代码的文章就介绍到这了,更多相关python xml转txt内容请搜索<编程笔记>以前的文章或继续浏览下面的相关文章希望大家以后多多支持<编程笔记>!

需要了解更多python教程分享Python实现xml格式转txt格式的示例代码,都可以关注python教程分享栏目&#8212;编程笔记


推荐阅读
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • 展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
  • 在Xamarin XAML语言中如何在页面级别构建ControlTemplate控件模板
    本文介绍了在Xamarin XAML语言中如何在页面级别构建ControlTemplate控件模板的方法和步骤,包括将ResourceDictionary添加到页面中以及在ResourceDictionary中实现模板的构建。通过本文的阅读,读者可以了解到在Xamarin XAML语言中构建控件模板的具体操作步骤和语法形式。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本文详细介绍了Java中vector的使用方法和相关知识,包括vector类的功能、构造方法和使用注意事项。通过使用vector类,可以方便地实现动态数组的功能,并且可以随意插入不同类型的对象,进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下,使用vector类是一个很好的选择。 ... [详细]
  • [大整数乘法] java代码实现
    本文介绍了使用java代码实现大整数乘法的过程,同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率,并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]
  • Android开发实现的计时器功能示例
    本文分享了Android开发实现的计时器功能示例,包括效果图、布局和按钮的使用。通过使用Chronometer控件,可以实现计时器功能。该示例适用于Android平台,供开发者参考。 ... [详细]
  • web.py开发web 第八章 Formalchemy 服务端验证方法
    本文介绍了在web.py开发中使用Formalchemy进行服务端表单数据验证的方法。以User表单为例,详细说明了对各字段的验证要求,包括必填、长度限制、唯一性等。同时介绍了如何自定义验证方法来实现验证唯一性和两个密码是否相等的功能。该文提供了相关代码示例。 ... [详细]
  • 本文介绍了使用Spark实现低配版高斯朴素贝叶斯模型的原因和原理。随着数据量的增大,单机上运行高斯朴素贝叶斯模型会变得很慢,因此考虑使用Spark来加速运行。然而,Spark的MLlib并没有实现高斯朴素贝叶斯模型,因此需要自己动手实现。文章还介绍了朴素贝叶斯的原理和公式,并对具有多个特征和类别的模型进行了讨论。最后,作者总结了实现低配版高斯朴素贝叶斯模型的步骤。 ... [详细]
  • 解决python matplotlib画水平直线的问题
    本文介绍了在使用python的matplotlib库画水平直线时可能遇到的问题,并提供了解决方法。通过导入numpy和matplotlib.pyplot模块,设置绘图对象的宽度和高度,以及使用plot函数绘制水平直线,可以解决该问题。 ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
  • 本文介绍了Swing组件的用法,重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联,可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法,并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]
author-avatar
空瓶子姑娘_537
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有