热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Flink基础知识的简单理解

Flink基础知识整理

Flink介绍

Apache Flink is a framework and distributed processing engine for stateful computations over unbounded and bounded data streams.
Apache Flink 是一个框架和分布式处理引擎,用于对***和有界数据流进行状态计算。

流处理介绍

事务处理(OLTP)
Flink基础知识的简单理解
OLTP:在线事务处理,所有事件都存储到MySQL里。

分析处理(Hive) (MySQL -> Sqoop -> Hive)
将数据从业务数据库复制到数仓,再进行分析和查询
Flink基础知识的简单理解
将MySQL里的数据进行ETL,把它同步到数仓中,然后做报表分析或者做一些其他的查询。比如用Sqoop把MySQL的数据同步到Hive中,所有都在Hive中进行查询。

有状态的流式处理
Flink基础知识的简单理解
流处理:当橙色圆圈来了以后经过业务模式处理可以直接向下游发送。每来一次事件就触发一次流处理的计算逻辑,对比于SparkStreaming而言是要经过至少攒500ms触发一次微批处理。

有状态流处理:保存一段时间的数据来进行计算,比如橙色圆点经过业务模式里的Local State还要定期经过检查点并且来一条数据+1 类似累加器 。

Flink主要特点

  1. 事件驱动:来一条事件进行一次处理;
  2. 基于流的世界观:在 Flink 的世界观中,⼀切都是由流组成的,离线数据是有界的流;实时数据是⼀个没有界限的流:这就是所谓的有界流和⽆界流;
  3. Flink的分层API: 越顶层越抽象,表达含义越简明,⽤越⽅便,越底层越具体,表达能⼒越丰富,使⽤越灵活;
  4. ⽀持事件时间(event-time)和处理时间(processing-time)语义;
  5. 精确⼀次(exactly-once)的状态⼀致性保证;
  6. 低延迟,每秒处理数百万个事件,毫秒级延迟(实际上就是没有延迟);
  7. 与众多常⽤存储系统的连接(ES,HBase,MySQL,Redis…);
  8. ⾼可⽤(zookeeper),动态扩展,实现7*24⼩时全天候运⾏。

事件时间:事件真实发⽣的时间,要求数据中包含时间戳
处理时间:事件到达节点时当前节点的机器时间


推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商,服务新产业周期的IoT&5G、边缘计算与云计算市场,交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文介绍了在SpringBoot中集成thymeleaf前端模版的配置步骤,包括在application.properties配置文件中添加thymeleaf的配置信息,引入thymeleaf的jar包,以及创建PageController并添加index方法。 ... [详细]
  • 本文由编程笔记小编整理,介绍了PHP中的MySQL函数库及其常用函数,包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • 解决VS写C#项目导入MySQL数据源报错“You have a usable connection already”问题的正确方法
    本文介绍了在VS写C#项目导入MySQL数据源时出现报错“You have a usable connection already”的问题,并给出了正确的解决方法。详细描述了问题的出现情况和报错信息,并提供了解决该问题的步骤和注意事项。 ... [详细]
  • ubuntu用sqoop将数据从hive导入mysql时,命令: ... [详细]
  • 如何在php中将mysql查询结果赋值给变量
    本文介绍了在php中将mysql查询结果赋值给变量的方法,包括从mysql表中查询count(学号)并赋值给一个变量,以及如何将sql中查询单条结果赋值给php页面的一个变量。同时还讨论了php调用mysql查询结果到变量的方法,并提供了示例代码。 ... [详细]
  • IT方面的论坛太多了,有综合,有专业,有行业,在各个论坛里混了几年,体会颇深,以前是论坛哪里人多 ... [详细]
  • 本文介绍了在Ubuntu下制作deb安装包及离线安装包的方法,通过备份/var/cache/apt/archives文件夹中的安装包,并建立包列表及依赖信息文件,添加本地源,更新源列表,可以在没有网络的情况下更新系统。同时提供了命令示例和资源下载链接。 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • 本文介绍了Hive常用命令及其用途,包括列出数据表、显示表字段信息、进入数据库、执行select操作、导出数据到csv文件等。同时还涉及了在AndroidManifest.xml中获取meta-data的value值的方法。 ... [详细]
  • oracle恢复失败,RMAN数据库恢复失败解决一例
    问题:这是一个从RAC环境的数据库的RAMN备份恢复到一个单机数据库的操作。当恢复数据文件和恢复正常,但在open数据库时出报下面的错误。--rman备 ... [详细]
author-avatar
无内功不5功
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有