本文是我研究Kafka的一点心得,欢迎指出纰漏
更多访问 我的博客
Kafka 作为愈加流行的流处理平台,让人好奇它为何如此受人青睐,盛名之下无虚士,我从性能角度来探索 Kafka 的奥妙。
首先,明确研究问题的方向。Kafka 是一个分布式的流式数据平台
它的重要功能有:
在大数据需求背景下,Kafka 必然要对以上功能进行性能优化,性能的优化要点/瓶颈在于:
利用操作系统的IO优化技术,脱离JVM的内存局限。
为什么从操作系统说起呢?人们每天都在使用操作系统,反而普遍忽略的操作系统的作用,让我们回想起来,操作系统的一大作用是消除硬件差异,为用户程序提供统一标准的API,由此,大部分人使用IO停留在调用系统的 read/write
,后端工程师则会更多了解 NIO
的 epoll/kqueue。仅此而已了吗? 让我们看看下面优化策略:
实际上,现代的操作系统已经对磁盘IO做了复杂的优化,Linux 下有一个常见的缩写名词 vfs,即虚拟文件系统(virtual file system),它对内存与外存(磁盘)进行映射,使读写速度得到提升,比如以下且不限于:
本文发布于:2024-02-02 16:14:23,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170686166244946.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |