flink sql 知其所以然(五)

阅读: 评论:0

flink sql 知其所以然(五)

flink sql 知其所以然(五)

感谢您的关注  +  点赞 + 再看,对博主的肯定,会督促博主持续的输出更多的优质实战内容!!!

1.序篇-本文结构

大数据羊说

用数据提升美好事物发生的概率~

30篇原创内容

公众号

protobuf 作为目前各大公司中最广泛使用的高效的协议数据交换格式工具库,会大量作为流式数据传输的序列化方式,所以在 flink sql 中如果能实现 protobuf 的 format 会非常有用(目前社区已经有对应的实现,不过目前还没有 merge,预计在 1.14 系列版本中能 release)。

issue 见:;jql=project%20%3D%20FLINK%20AND%20issuetype%20%3D%20%22New%20Feature%22%20AND%20text%20~%20protobuf%20order%20by%20created%20DESC

pr 见:

这一节主要介绍 flink sql 中怎么自定义实现 format,其中以最常使用的 protobuf 作为案例来介绍。

  1. 背景篇-为啥需要 protobuf format

  2. 目标篇-protobuf format 预期效果

  3. 难点剖析篇-此框架建设的难点、目前有哪些实现

  4. 维表实现篇-实现的过程

  5. 总结与展望篇

如果想在本地直接测试下:

  1. 在公众号后台回复
  • flink sql 知其所以然(五)| 自定义 protobuf format获取源码(源码基于 1.13.1 实现)

  • flink sql 知其所以然(五)| 自定义 protobuf format获取源码(源码基于 1.13.1 实现)

  • flink sql 知其所以然(五)| 自定义 protobuf format获取源码(源码基于 1.13.1 实现)

  1. 执行源码包中的  测试类来制造 protobuf 数据

  2. 然后执行源码包中的  测试类来消费 protobuf 数据,并且打印在 console 中,然后就可以在 console 中看到结果。

2.背景篇-为啥需要 protobuf format

关于为什么选择 protobuf 可以看这篇文章,写的很详细:

/?utm_source=tuicool&utm_medium=referral

在实时计算的领域中,为了可读性会选择 json,为了效率以及一些已经依赖了 grpc 的公司会选择 protobuf 来做数据序列化,那么自然而然,日志的序列化方式也会选择 protobuf

而官方目前已经 release 的版本中是没有提供 flink sql api 的 protobuf format 的。如下图,基于 1.13 版本。

.13/docs/connectors/table/overview/

1

因此本文在介绍怎样自定义一个 format 的同时,实现一个 protobuf format 来给大家使用。

3.目标篇-protobuf format 预期效果

预期效果是先实现几种最基本的数据类型,包括 protobuf 中的 message(自定义 model)、map(映射)、repeated(列表)、其他基本数据类型等,这些都是我们最常使用的类型。

预期 protobuf message 定义如下:

2

测试数据源数据如下,博主把 protobuf 的数据转换为 json,以方便展示,如下图:

3

预期 flink sql:

数据源表 DDL:

CREATE TABLE protobuf_source

本文发布于:2024-01-27 18:00:40,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/17063496431778.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所以然   flink   sql
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23