感谢您的关注 + 点赞 + 再看,对博主的肯定,会督促博主持续的输出更多的优质实战内容!!!
大数据羊说
用数据提升美好事物发生的概率~
30篇原创内容
公众号
protobuf
作为目前各大公司中最广泛使用的高效的协议数据交换格式工具库,会大量作为流式数据传输的序列化方式,所以在 flink sql 中如果能实现 protobuf
的 format
会非常有用(目前社区已经有对应的实现,不过目前还没有 merge,预计在 1.14 系列版本中能 release)。
issue
见:;jql=project%20%3D%20FLINK%20AND%20issuetype%20%3D%20%22New%20Feature%22%20AND%20text%20~%20protobuf%20order%20by%20created%20DESC
pr
见:
这一节主要介绍 flink sql 中怎么自定义实现 format
,其中以最常使用的 protobuf
作为案例来介绍。
背景篇-为啥需要 protobuf format
目标篇-protobuf format 预期效果
难点剖析篇-此框架建设的难点、目前有哪些实现
维表实现篇-实现的过程
总结与展望篇
如果想在本地直接测试下:
flink sql 知其所以然(五)| 自定义 protobuf format获取源码(源码基于 1.13.1 实现)
flink sql 知其所以然(五)| 自定义 protobuf format获取源码(源码基于 1.13.1 实现)
flink sql 知其所以然(五)| 自定义 protobuf format获取源码(源码基于 1.13.1 实现)
执行源码包中的
然后执行源码包中的
关于为什么选择 protobuf
可以看这篇文章,写的很详细:
/?utm_source=tuicool&utm_medium=referral
在实时计算的领域中,为了可读性会选择 json
,为了效率以及一些已经依赖了 grpc
的公司会选择 protobuf
来做数据序列化,那么自然而然,日志的序列化方式也会选择 protobuf
。
而官方目前已经 release 的版本中是没有提供 flink sql api 的 protobuf format
的。如下图,基于 1.13 版本。
.13/docs/connectors/table/overview/
1
因此本文在介绍怎样自定义一个 format 的同时,实现一个 protobuf format 来给大家使用。
预期效果是先实现几种最基本的数据类型,包括 protobuf 中的 message
(自定义 model)、map
(映射)、repeated
(列表)、其他基本数据类型等,这些都是我们最常使用的类型。
预期 protobuf message 定义如下:
2
测试数据源数据如下,博主把 protobuf 的数据转换为 json,以方便展示,如下图:
3
预期 flink sql:
数据源表 DDL:
CREATE TABLE protobuf_source
本文发布于:2024-01-27 18:00:40,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/17063496431778.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |