热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

sparkmysql排序_spark学习进度26(sparksql编程初级实践)

SparkSQL基本操作:将下列JSON格式数据复制到Linux系统中,并保存命名为employee.json。{id:1,name:Ella

Spark SQL 基本操作:

将下列 JSON 格式数据复制到 Linux 系统中,并保存命名为 employee.json。

{ "id":1 , "name":"Ella" , "age":36}

{"id":2, "name":"Bob","age":29}

{"id":3 , "name":"Jack","age":29}

{"id":4 , "name":"Jim","age":28}

{"id":4 , "name":"Jim","age":28}

{"id":5 , "name":"Damon"}

{"id":5 , "name":"Damon" }

为 employee.json 创建 DataFrame,并写出 Scala 语句完成下列操作:

(1) 查询所有数据;

7bcfce63e40694556b310cc159b432e6.png

(2) 查询所有数据,并去除重复的数据;

433343ebc1d94641947319b4554d2965.png

(3) 查询所有数据,打印时去除 id 字段;

b86d66927c622b60710a0c359626dccf.png

(4) 筛选出 age>30 的记录;

f2c884b7a8cd50757ddf48cf97a16eb1.png

(5) 将数据按 age 分组;

0fa6c3c6c02e3b66c9b003b3cb8e96f8.png

(6) 将数据按 name 升序排列;

c305f430483729d6ad8cde3a2f1ac16a.png

(7) 取出前 3 行数据;

59910f6c5274bdd5c6b9090438dcfcba.png

(8) 查询所有记录的 name 列,并为其取别名为 username;

98d768f6806a9aaa1ddb856b3569f6b5.png

(9) 查询年龄 age 的平均值;

0ce765f2ba7c7ea9b7161a4a9e3a9230.png

(10) 查询年龄 age 的最小值。

0442ed0f52e768b7470ea92f89498083.png

编程实现将 RDD 转换为 DataFrame :

源文件内容如下(包含 id,name,age):

1,Ella,36

2,Bob,29

3,Jack,29

请将数据复制保存到 Linux 系统中,命名为 employee.txt,实现从 RDD 转换得到 DataFrame,并按“id:1,name:Ella,age:36”的格式打印出 DataFrame 的所有数据。请写出程序代码。

classwoyesql {

@Test

def test(): Unit={

val spark=SparkSession.builder()

.appName("datafreame1")

.master("local[6]")

.getOrCreate()

import spark.implicits._

val df=spark.sparkContext.textFile("dataset/employee.txt").map(_.split(","))

.map(item=> Employee(item(0).trim.toInt,item(1),item(2).trim.toInt))

.toDF()

df.createOrReplaceTempView("employee")//创工作空间

val dfRDD=spark.sql("select * from employee")

dfRDD.map(it=> "id:"+it(0) +",name:"+it(1)+",age:"+it(2) )

.show()

}

}case class Employee(id:Int,name:String,age:Long)

1f06a913482ba04999eb92b58d125520.png

编程实现利用 DataFrame 读写 MySQL 的数据:

(1)在 MySQL 数据库中新建数据库 sparktest,再创建表 employee,包含如表 6-2 所示的 两行数据。

4e0bb5fc2bf72429fd700f3396c42471.png

dd5159b109b7c3f785a387d0aac6b14d.png

0ff22509f110fab815d738caa8c24212.png

(2)配置 Spark 通过 JDBC 连接数据库 MySQL,编程实现利用 DataFrame 插入如表 6-3 所 示的两行数据到 MySQL 中,最后打印出 age 的最大值和 age 的总和。

73e310c995940d381d0ab65ab708f472.png

@Test

def sqlwrite():Unit={

val spark=SparkSession

.builder()

.appName("mysql example")

.master("local[6]")

.getOrCreate()

val schema=StructType(

List(

StructField("id", IntegerType),

StructField("name", StringType),

StructField("gender", StringType),

StructField("age", IntegerType)

)

)

val studentDF=spark.read//分隔符:制表符

.option("delimiter", ",")

.schema(schema)

.csv("dataset/stu")

studentDF.write

.format("jdbc")

.mode(SaveMode.Append)//模式是追加

.option("url", "jdbc:mysql://hadooplinux01:3306/spark02")

.option("dbtable", "employee")

.option("user", "root")

.option("password", "511924")

.save()

spark.read

.format("jdbc")

.option("url", "jdbc:mysql://hadooplinux01:3306/spark02")

.option("dbtable","(select max(age),SUM(age) from employee) as emp")

.option("user", "root")

.option("password", "511924")

.load()

.show()

}

0ebd5a18c0a2622b97a39c6adf4ac102.png

原文:https://www.cnblogs.com/dazhi151/p/14274789.html



推荐阅读
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 拥抱Android Design Support Library新变化(导航视图、悬浮ActionBar)
    转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一,为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]
  • 自动轮播,反转播放的ViewPagerAdapter的使用方法和效果展示
    本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter,并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]
  • Html5-Canvas实现简易的抽奖转盘效果
    本文介绍了如何使用Html5和Canvas标签来实现简易的抽奖转盘效果,同时使用了jQueryRotate.js旋转插件。文章中给出了主要的html和css代码,并展示了实现的基本效果。 ... [详细]
  • 摘要: 在测试数据中,生成中文姓名是一个常见的需求。本文介绍了使用C#编写的随机生成中文姓名的方法,并分享了相关代码。作者欢迎读者提出意见和建议。 ... [详细]
  • 第四章高阶函数(参数传递、高阶函数、lambda表达式)(python进阶)的讲解和应用
    本文主要讲解了第四章高阶函数(参数传递、高阶函数、lambda表达式)的相关知识,包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念,并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说,本文将是一个不错的学习资料。 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计,并以数字赋能和创新驱动高质量发展的理念,建设了集成、智慧、高效的一体化城市综合管理平台,促进了城市的数字化转型。该中心被称为当代城市的智能心脏,为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]
  • 本文介绍了C#中数据集DataSet对象的使用及相关方法详解,包括DataSet对象的概述、与数据关系对象的互联、Rows集合和Columns集合的组成,以及DataSet对象常用的方法之一——Merge方法的使用。通过本文的阅读,读者可以了解到DataSet对象在C#中的重要性和使用方法。 ... [详细]
  • 本文介绍了在Win10上安装WinPythonHadoop的详细步骤,包括安装Python环境、安装JDK8、安装pyspark、安装Hadoop和Spark、设置环境变量、下载winutils.exe等。同时提醒注意Hadoop版本与pyspark版本的一致性,并建议重启电脑以确保安装成功。 ... [详细]
author-avatar
阳光卐誓言
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有