- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

图解微服务 Zipkin 链路追踪原理，一文吃透！

mikechen的互联网架构发表于 2024/11/13 21:45:33 2024/11/13

【摘要】本文重点讲解 Zipkin 链路追踪的原理与使用，帮助解决微服务架构下的服务响应延迟等问题，提升系统性能与稳定性。关注【mikechen的互联网架构】，10年+BAT架构经验倾囊相授。

关注△mikechen的互联网架构△，10年+BAT架构经验倾囊相授

大家好，我是 [mikechen | 陈睿]((https://mikechen.cc/about-me) 。

随着微服务系统拆分后，急需链路追踪有故障的服务，今天就重点讲解Zipkin链路追踪的原理与使用@mikechen

Zipkin

Zipkin是一款开源的分布式实时数据追踪系统（Distributed Tracking System），能够收集服务间调用的时序数据，提供调用链路的追踪。

Zipkin其主要功能是聚集来自各个异构系统的实时监控数据，在微服务架构下，十分方便地用于服务响应延迟等问题的定位。

Zipkin每一个调用链路通过一个trace id来串联起来，只要你有一个trace id，就能够直接定位到这次调用链路，并且可以根据服务名、标签、响应时间等进行查询，过滤那些耗时比较长的链路节点。

为什么用 Zipkin？

大型互联网公司为什么需要分布式跟踪系统？

随着业务访问量越来越大，比如：典型的淘宝从早期的单体开始往分布式微服务演变，系统也随之进行各种拆分，看似简单的一个应用，后台可能有几十个甚至几百个服务在支撑。

一个前端的请求，比如：一次下订单请求，可能需要多次的服务调用：商品、用户、店铺等系统调用过程，最后才能完成。

当请求变慢或者不可用时，我们无法得知是哪个后台服务引起的，这时就需要解决如何快速定位服务故障点。

Zipkin分布式跟踪系统就能很好的解决这样的问题。

Zipkin分布式跟踪系统主要解决以下3点问题：

1.动态展示服务的链路；

2.分析服务链路的瓶颈并对其进行调优；

3.快速进行服务链路的故障发现。

这就是Zipkin服务跟踪系统存在的目的和意义。

当然除了Zipkin分布式跟踪系统，还有其他比较成熟的实现，例如：Naver的Pinpoint、Apache的HTrace、阿里的鹰眼Tracing、京东的Hydra、新浪的Watchman，美团点评的CAT，Skywalking等。

本文我重点谈谈Zipkin链路追踪原理机制@mikechen

Zipkin的原理

1.ZipKin架构

ZipKin可以分为两部分：

ZipKin Server：用来作为数据的采集存储、数据分析与展示；
ZipKin Client：基于不同的语言及框架封装的一些列客户端工具，这些工具完成了追踪数据的生成与上报功能。

整体架构如下：

2.Zipkin核心组件

zipkin(服务端)包含四个组件，分别是collector、storage、search、web UI。

1)collector(信息收集器)

collector接受或者收集各个应用传输的数据。

2)storage(存储组件)

zipkin 默认直接将数据存在内存中，此外支持使用Cassandra、ElasticSearch 和 Mysql。

3)search (查询进程)

它提供了简单的JSON API来供外部调用查询。

4)web UI (服务端展示平台)

主要是提供简单的web界面，用图表将链路信息清晰地展示给开发人员。

3.Zipkin核心结构

当用户发起一次调用时，Zipkin 的客户端会在入口处为整条调用链路生成一个全局唯一的 trace id，并为这条链路中的每一次分布式调用生成一个 span id。

一个 trace 由一组 span 组成，可以看成是由 trace 为根节点，span 为若干个子节点的一棵树，如下图所示：

4.Zipkin的工作流程

一个应用的代码发起HTTP get请求，经过Trace框架拦截，大致流程如下图所示:

1）把当前调用链的Trace信息添加到HTTP Header里面；

2）记录当前调用的时间戳；

3）发送HTTP请求，把trace相关的header信息携带上；

4）调用结束之后，记录当前调用话费的时间；

5）然后把上面流程产生的信息汇集成一个span，把这个span信息上传到zipkin的Collector模块。

Zipkin的部署与运行

Zipkin的 github 地址：https://github.com/apache/incubator-zipkin

Docker 方式

docker run -d -p 9411:9411 openzipkin/zipkin

Jar 包方式（JDK8）

curl -sSL https://zipkin.apache.org/quickstart.sh | bash -s

java -jar zipkin.jar

注意：以上方式的 Zipkin 都是基于内存存储，Zipkin 重启后数据会丢失，建议测试环境使用。

Zipkin 支持的存储类型有 inMemory、MySql、Cassandra、以及 ElasticsSearch 几种方式。

正式环境推荐使用 Cassandra 和 ElasticSearch。

Zipkin总结

本篇重点讲解了为什么要使用Zipkin，以及Zipkin的架构，核心组件，以及Zipkin的工作流程，希望对大家掌握微服务有所帮助@mikechen，欢迎评论区留言交流或拓展。

我是 [mikechen | 陈睿]((https://mikechen.cc/about-me) ，关注【mikechen的互联网架构】，10年+BAT架构技术倾囊相授。

本文已同步我的技术博客 www.mikechen.cc，更新至我原创的《30W+字大厂架构技术合集》中。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

图解微服务 Zipkin 链路追踪原理，一文吃透！

Zipkin

为什么用 Zipkin？

Zipkin的原理

1.ZipKin架构

2.Zipkin核心组件

3.Zipkin核心结构

4.Zipkin的工作流程

Zipkin的部署与运行

Zipkin总结

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

图解微服务 Zipkin 链路追踪原理，一文吃透！

Zipkin

为什么用 Zipkin？

Zipkin的原理

1.ZipKin架构

2.Zipkin核心组件

3.Zipkin核心结构

4.Zipkin的工作流程

Zipkin的部署与运行

Zipkin总结

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品