热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

分段读取csv文件并可视化处理

篇首语:本文由编程笔记#小编为大家整理,主要介绍了分段读取csv文件并可视化处理相关的知识,希望对你有一定的参考价值。 1.数据 使用数据为csv文件,数据有89万条记录,

篇首语:本文由编程笔记#小编为大家整理,主要介绍了分段读取csv文件并可视化处理相关的知识,希望对你有一定的参考价值。



1.数据

使用数据为csv文件,数据有89万条记录,名称字段具体如下:


Time (sec)

Delta Time (sec)

Segment ID

Latitude (deg)

Longitude (deg)

Easting (m)

Northing (m)

Cross-Track (m)

Along-Track (m)

Height (m HAE)

Height (m MSL)

Classification

Signal Confidence

Dem_height

luccID

32.56000081

78976682.22

161266

29.08135819

113.4059348

734190.7155

3219390.276

-22.7432411

20201.67926

77.74754333

93.76404762

0

0

0

0

32.56000081

78976682.22

161266

29.08135858

113.4059346

734190.7011

3219390.318

-22.7526257

20201.72316

91.41132355

107.4278278

0

0

0

0

32.56000081

78976682.22

161266

29.08135802

113.4059348

734190.722

3219390.257

-22.7389931

20201.65946

71.5628891

87.57939339

0

0

0

0

32.56000081

78976682.22

161266

29.08135773

113.4059349

734190.733

3219390.224

-22.7318915

20201.62621

61.22312164

77.23962593

0

0

0

0

32.56000081

78976682.22

161266

29.08135811

113.4059348

734190.7185

3219390.267

-22.7412967

20201.67021

74.91683197

90.93333626

0

0

0

0

32.56000081

78976682.22

161266

29.08135616

113.4059355

734190.7915

3219390.052

-22.6938061

20201.44813

5.772859573

21.78936386

0

0

0

0

32.56000081

78976682.22

161266

29.08135614

113.4059355

734190.7922

3219390.05

-22.6933262

20201.44587

5.074115753

21.09062004

0

0

0

0

32.56000081

78976682.22

161266

29.08135651

113.4059354

734190.7784

3219390.091

-22.7023598

20201.48811

18.22643089

34.24293518

0

0

0

0

32.56000081

78976682.22

161266

29.08135656

113.4059354

734190.7765

3219390.096

-22.7035772

20201.49374

19.99853134

36.01503563

0

0

0

0

32.56000081

78976682.22

161266

29.08135584

113.4059356

734190.8036

3219390.016

-22.6859499

20201.41132

-5.66560459

10.3508997

0

0

0

0

32.56010081

78976682.22

161266

29.08136468

113.405934

734190.6294

3219390.994

-22.7452324

20202.4024

80.65776825

96.67429392

0

0

0

0


2.读取数据 

2.1完整读取数据并显示

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
inputpath=r"E:\\csv_dbscan\\ATL03_20200703015729_01180802_005_01_gt1r.csv"
df=pd.read_csv(inputpath)
X=df['Time (sec)']
Y=df['Height (m HAE)']
plt.figure()
plt.scatter(X,Y,marker='o',s=0.000003,label='Point Cloud')
plt.legend()
plt.show()

放大显示:


 2.2分段读取数据并显示

(1)根据总记录数和分段数来计算每段的数量是多少,然后我们每次只读取一段数据。

方法1:使用chunksize参数实现分段读取和显示

chunksize是按照行记录数量来分段的

df_chunker = pd.read_csv(inputpath,chunksize=segment_count)
for df_item in df_chunker:
X_seg = df_item['Time (sec)']
Y_seg = df_item['Height (m HAE)']
plt.figure()
plt.scatter(X_seg, Y_seg, marker='o', s=1, label='Point Cloud')
plt.legend()
plt.show()

比如我们每段数据设置为segment_count=10000条,那么就有segment_n=N/segment_count(segment_count每段记录数,N总记录数,segment_n为段数)段数据。

我们按照顺序读取每段数据并显示:

方法2:使用沿线距离来分段显示 

比如我们使用Along-Track (m)属性1000m分段显示:第一段的范围是20201.67926-20301.67926,后面依次加1000.

len_data=len(df['Time (sec)']) #行记录数
segment_count=1000
Along_track_n=int((df['AlongTrack'][len_data-1]-df['AlongTrack'][0])/segment_count)+1
start=df['AlongTrack'][0]
end=df['AlongTrack'][len_data-1]
for len_seg in range(Along_track_n):
df_seg &#61; df.loc[(df[&#39;AlongTrack&#39;] >&#61; (start &#43; len_seg * segment_count)) & (df[&#39;AlongTrack&#39;] <&#61; (start&#43; (len_seg &#43; 1) * segment_count)),:]
X_seg &#61; df_seg[&#39;AlongTrack&#39;]
Y_seg &#61; df_seg[&#39;Height (m HAE)&#39;]
if len(X_seg)&#61;&#61;0:
print("该段没数据&#xff01;")
plt.figure()
plt.scatter(X_seg, Y_seg, marker&#61;&#39;o&#39;, s&#61;1, label&#61;&#39;Point Cloud&#39;)
plt.legend()
plt.show()


推荐阅读
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商,服务新产业周期的IoT&5G、边缘计算与云计算市场,交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]
  • 展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]
  • CF:3D City Model(小思维)问题解析和代码实现
    本文通过解析CF:3D City Model问题,介绍了问题的背景和要求,并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景,每个网格单元可以作为建筑的基础,建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路,并给出了相应的代码实现供读者参考。 ... [详细]
  • 在Xamarin XAML语言中如何在页面级别构建ControlTemplate控件模板
    本文介绍了在Xamarin XAML语言中如何在页面级别构建ControlTemplate控件模板的方法和步骤,包括将ResourceDictionary添加到页面中以及在ResourceDictionary中实现模板的构建。通过本文的阅读,读者可以了解到在Xamarin XAML语言中构建控件模板的具体操作步骤和语法形式。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析
    本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程,并分析了其所需的资源容量。通过解决错误提示和调整内存大小,成功存储了波形数据。然后,讨论了储存环逐束团信号的意义,以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大,每天需要近250G,一年需要90T。然而,储存环逐束团信号具有重要意义,可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]
  • 本文介绍了brain的意思、读音、翻译、用法、发音、词组、同反义词等内容,以及脑新东方在线英语词典的相关信息。还包括了brain的词汇搭配、形容词和名词的用法,以及与brain相关的短语和词组。此外,还介绍了与brain相关的医学术语和智囊团等相关内容。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • Android Studio Bumblebee | 2021.1.1(大黄蜂版本使用介绍)
    本文介绍了Android Studio Bumblebee | 2021.1.1(大黄蜂版本)的使用方法和相关知识,包括Gradle的介绍、设备管理器的配置、无线调试、新版本问题等内容。同时还提供了更新版本的下载地址和启动页面截图。 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
author-avatar
SHARK
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有