Kernel – Mark 的滿紙方糖言

轻量 eBPF+Prometheus+Trace - 微处觀自在

📅 2024年06月23日 · ☕ 6 分钟

以 ebpf_exporter 持续跟踪内核的 TCP/进程行为为例，说明基于轻量 eBPF+Prometheus+Trace 的定制系统底层观察和观察数据集成方法。

eBPF 求证坊间传闻：Java GC 日志可导致整个 JVM 服务卡顿？

📅 2023年09月23日 · ☕ 9 分钟

实现世界的 Java 应用，都会记录 GC 日志。但不是所有人都知道小小的日志可能导致整个 JVM 服务卡顿。本文尝试用 eBPF 等分析方法，去证明具体环境下，问题的存在与否。

eBPF 求证坊间传闻：mmap + Java Safepoint 可导致整个 JVM 服务卡顿？

📅 2023年09月23日 · ☕ 7 分钟

Java 离不开 Safepoint。但不是所有人都知道方便的 mmap 映射文件，可能会导致整个 JVM 服务由于 safepoint 到达延时而卡顿。本文尝试用 eBPF 等分析方法，去证明具体环境下，问题的存在与否。

如何测量进程级别或容器级别的 IO 延迟

📅 2023年09月23日 · ☕ 3 分钟

发现了 IO 延迟问题后，如何定位到问题进程，如果测试 IO 延迟问影响了哪些进程，影响有多大？

基于 libbpf 的 TCP 连接延迟监视工具 tcpconnlat 分析 - eBPF基础知识 Part5

📅 2023年04月12日 · ☕ 6 分钟

通过分析 BCC 的基于 libbpf 的 TCP 连接延迟监视工具 tcpconnlat 实现，来了解一个经典 BPF 程序是如何加载，绑定，以及与内核互动的。

经典 libbpf 范例: uprobe 分析 - eBPF基础知识 Part4

📅 2023年04月03日 · ☕ 6 分钟

通过分析 libbpf 范例 libbpf-bootstrap 中的 uprobe 程序，来了解一个经典 BPF uprobe 程序是如何加载，绑定，以及与内核互动的。

经典 libbpf 范例: bootstrap 分析 - eBPF基础知识 Part3

📅 2023年03月25日 · ☕ 5 分钟

通过分析 libbpf 范例 libbpf-bootstrap 中的 bootstrap 程序，来了解一个经典 BPF 程序是如何与内核互动的。

BPF 系统接口与 libbpf 示例分析 - eBPF基础知识 Part2

📅 2023年03月11日 · ☕ 6 分钟

BPF 系统接口与 libbpf 示例分析 - eBPF基础知识 Part2

ELF 格式简述 - eBPF基础知识 Part1

📅 2023年03月04日 · ☕ 7 分钟

为何要研究 ELF 格式？因为想深入点学习 eBPF ，充分利用它的特性，而非只利用它的名声，ELF 格式是跳不过的

实时跟踪内核 TCP 连接失败与重试 - 基于 BPF

📅 2023年02月17日 · ☕ 4 分钟

实时跟踪内核 TCP 连接失败与重试 - 基于 BPF

容器化 TCP Socket 缓存、接收窗口参数

📅 2022年10月02日 · ☕ 11 分钟

最近需要支持一个单实例 TCP 连接数上 10k 的基础服务(Cassandra)的容器化。需要对其使用的资源（特别是TCP缓存内存）、对相邻 Pod（同一 worker node 上运行的）影响（即容器隔离情况），等时行预估。故写本文，以备忘

可能是最完整的 TCP 连接健康指标工具 ss 的说明

📅 2022年10月01日 · ☕ 10 分钟

写在前面

我不是网络专家，只是在经历了多年的生产和测试环境网络问题排查后，不想再得过且过，于是记录下所学到的知识。由于对 TCP 栈的实现了解有限，所以内容仅作参考。

玩火的容器内存控制 CGroup - 容器基础拾遗 Part 1

📅 2022年07月10日 · ☕ 20 分钟

容器内存限制是个矛盾而重要的选择，给多了浪费资源，给少了服务随机崩溃。CGroup 内存控制是容器资源控制的核心。她是个规律严明的看守者，在应用超限时狠心地 OOM Klll。她同时也有宽容的一面，在应用资源不足时，调配和释放 Cache 给应用使用。而其内心的记账算法却耐人寻味。要观察和监控她的状态和行为，更是千条万绪。本文尝试用作分析和梳理。

1
2
3