- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Flink与Redis集成：实现低延迟数据查询

超梦发表于 2026/01/23 12:33:46 2026/01/23

【摘要】在实时大数据处理领域，Flink凭借其卓越的流批一体计算能力，成为处理高吞吐、低延迟数据流的首选引擎。而Redis作为一款高性能的内存键值数据库，以毫秒级响应速度、丰富的数据结构及高可用性，在缓存、会话存储、实时计数等场景中不可或缺。将Flink与Redis集成，可构建“实时计算-内存存储-低延迟查询”的闭环，既能让Flink的计算结果快速落地至Redis供业务查询，也能借助Redis缓存历...

在实时大数据处理领域，Flink凭借其卓越的流批一体计算能力，成为处理高吞吐、低延迟数据流的首选引擎。而Redis作为一款高性能的内存键值数据库，以毫秒级响应速度、丰富的数据结构及高可用性，在缓存、会话存储、实时计数等场景中不可或缺。将Flink与Redis集成，可构建“实时计算-内存存储-低延迟查询”的闭环，既能让Flink的计算结果快速落地至Redis供业务查询，也能借助Redis缓存历史数据辅助Flink完成关联分析，广泛适用于实时推荐、风控拦截、在线计数等对响应速度要求极高的场景。本文将从集成价值、核心原理及典型Sink场景实践，拆解两者的集成逻辑与落地要点。

集成核心价值：实时计算与内存存储的互补

Flink的核心优势在于对无界流数据的精准处理，支持 Exactly-Once 语义，能实时捕获数据流中的变化并完成聚合、关联等计算操作，但Flink自身不具备内存级存储能力，计算结果若落地至磁盘数据库，会产生不可忽视的查询延迟。Redis则以内存为核心存储介质，读写性能远超传统磁盘数据库，单节点可支撑每秒数十万次操作，同时提供字符串、哈希、列表、有序集合等多种数据结构，能灵活适配不同业务场景的存储需求。

两者集成后形成显著互补效应：一方面，Flink将实时计算结果（如用户实时点击量、设备在线状态、订单实时统计）写入Redis，业务系统可直接从Redis中查询最新结果，实现毫秒级响应；另一方面，Redis可作为Flink的“临时状态存储”或“历史数据缓存”，供Flink流处理任务快速关联历史数据，避免重复读取磁盘存储，提升计算效率。相较于其他存储方案，Redis的内存特性的让Flink计算结果的查询延迟降至最低，完美适配在线业务的实时查询需求。

集成核心原理：基于Connector的双向数据交互

Flink与Redis的集成依赖Flink官方提供的Redis Connector（Flink Redis Connector），该组件本质是对Redis Java客户端（如Jedis、Lettuce）的封装，实现了Flink的Sink（写入Redis）和Source（读取Redis）接口，支撑双向数据流转，同时适配Flink的Checkpoint机制，保障数据一致性。

从交互流程来看，Flink与Redis的集成可分为两个核心方向：一是Flink作为生产者，将计算结果通过Sink写入Redis；二是Flink作为消费者，通过Source读取Redis中的数据（缓存数据、配置信息等）辅助计算。其中，Sink场景更为常用，也是实时业务的核心落地方式。

Redis Connector的核心工作机制的是通过连接池管理与Redis集群的连接，避免频繁创建/销毁连接带来的性能开销。在写入流程中，Flink数据流的元素经序列化后，转换为Redis支持的键值对格式，通过预设的命令（如SET、HSET、INCR）发送至Redis；在读取流程中，Connector可通过扫描Redis键空间、监听键值变化等方式，将Redis中的数据转换为Flink DataStream，供后续计算逻辑处理。同时，针对数据一致性问题，Connector可结合Flink的Checkpoint机制，在Checkpoint触发时缓存待写入Redis的操作，待Checkpoint完成后再批量提交，避免因任务失败导致数据重复写入或丢失。

核心场景与实践：Redis作为Flink Sink的落地

Redis作为Flink Sink是最典型的集成场景，即Flink将实时计算结果写入Redis，供业务系统低延迟查询。结合Redis丰富的数据结构，常见的落地场景包括实时计数、用户状态缓存、热点数据存储等，下面结合具体场景与代码案例，拆解实现逻辑与关键配置。

环境依赖准备

首先需在Flink作业的pom.xml中引入Redis Connector依赖，同时适配对应的Flink与Redis版本（以Flink 1.17、Redis 6.x为例），推荐使用基于Lettuce客户端的Connector（性能更优，支持异步操作）：

<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-connector-redis_2.12</artifactId>
    <version>1.17.0</version>
</dependency>
<!-- 引入Lettuce客户端，提升连接性能 -->
<dependency>
    <groupId>io.lettuce</groupId>
    <artifactId>lettuce-core</artifactId>
    <version>6.2.6.RELEASE</version>
</dependency>

依赖引入后，需配置Redis连接信息（如节点地址、端口、密码、数据库索引），可通过配置类或配置文件指定，确保Flink能正常连接Redis集群或单机实例。

场景1：实时计数存储（哈希结构）

假设业务场景：Flink消费Kafka中的用户行为数据（如商品点击、收藏），实时统计每个商品的各类行为次数，将结果写入Redis哈希结构（Key为商品ID，Field为行为类型，Value为次数），业务系统可通过HGET/HGETALL快速查询商品实时行为数据。

核心代码实现如下，重点关注Redis Sink的配置、数据转换及命令映射：

// 1. 配置Redis连接信息
RedisConfiguration redisConf = RedisConfiguration.builder()
    .setHost("redis-node-1,redis-node-2") // Redis集群节点
    .setPort(6379)
    .setPassword("redis-password") // 若有密码需配置
    .setDatabase(0) // 目标数据库索引
    .setConnectionPoolSize(10) // 连接池大小
    .build();

// 2. 定义Redis Sink，指定数据写入逻辑（哈希结构）
RedisSink<Tuple3<String, String, Long>> redisSink = RedisSink.builder()
    .setRedisConfiguration(redisConf)
    .setCommandDescription(new RedisCommandDescription(RedisCommand.HSET, "product_behavior_count"))
    .setValueFormatter(new RedisValueFormatter<Tuple3<String, String, Long>>() {
        @Override
        public RedisRecord format(Tuple3<String, String, Long> value) {
            // value格式：(商品ID, 行为类型, 次数)
            String key = value.f0; // 哈希Key：商品ID
            String field = value.f1; // 哈希Field：行为类型（click/collect）
            String valueStr = value.f2.toString(); // 哈希Value：次数
            return RedisRecord.newRecord()
                .setKey(key)
                .setField(field)
                .setValue(valueStr);
        }
    })
    .build();

// 3. Flink作业主逻辑：消费Kafka → 实时聚合 → 写入Redis
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.enableCheckpointing(5000); // 开启Checkpoint保障一致性

DataStream<Tuple3<String, String, Long>> behaviorCountStream = env
    .addSource(new FlinkKafkaConsumer<>("user_behavior", new SimpleStringSchema(), kafkaConf))
    .map(data -> {
        // 解析Kafka数据，转换为(商品ID, 行为类型, 1)的Tuple
        JSONObject json = JSON.parseObject(data);
        String productId = json.getString("productId");
        String behaviorType = json.getString("behaviorType");
        return Tuple3.of(productId, behaviorType, 1L);
    })
    .keyBy(0, 1) // 按商品ID+行为类型分组
    .window(TumblingProcessingTimeWindows.of(Time.seconds(5))) // 5秒滚动窗口
    .sum(2); // 累加行为次数

// 将聚合结果写入Redis
behaviorCountStream.addSink(redisSink);

env.execute("Flink Real-Time Count to Redis");

场景2：用户状态缓存（字符串结构）

假设业务场景：Flink实时处理用户登录/登出数据，维护用户在线状态（在线/离线），将结果写入Redis字符串结构（Key为用户ID，Value为状态标识+更新时间），业务系统可通过GET快速查询用户当前状态，支撑实时会话管理。

该场景的核心差异在于Redis命令的选择（使用SET命令），数据转换逻辑调整如下：

// 定义SET命令的Sink配置
RedisSink<Tuple2<String, String>> userStatusSink = RedisSink.builder()
    .setRedisConfiguration(redisConf)
    .setCommandDescription(new RedisCommandDescription(RedisCommand.SET))
    .setValueFormatter(new RedisValueFormatter<Tuple2<String, String>>() {
        @Override
        public RedisRecord format(Tuple2<String, String> value) {
            // value格式：(用户ID, 状态信息，如"online,1678901234567")
            String key = value.f0;
            String statusValue = value.f1;
            // 可选：设置过期时间（如用户离线后1小时过期）
            return RedisRecord.newRecord()
                .setKey(key)
                .setValue(statusValue)
                .setExpiration(Expiration.seconds(3600));
        }
    })
    .build();

数据一致性与基础优化

在Sink场景落地中，需重点关注数据一致性与写入性能优化，避免因延迟或故障影响业务：

数据一致性保障：开启Flink Checkpoint后，Redis Sink会在Checkpoint完成后批量提交写入操作，若作业失败，可通过Checkpoint回滚，避免数据重复。若业务对一致性要求极高，可结合Redis的事务或Pipeline机制，进一步降低数据丢失风险。
写入性能优化：合理配置Redis连接池大小（根据Flink并行度调整，避免连接不足），使用Pipeline批量提交写入请求，减少网络往返开销；针对高频更新场景，优先选择Redis原子命令（如INCR、HINCRBY），避免Flink端聚合后再写入，提升效率。
集群适配：若Redis为集群模式，需确保Connector支持哈希槽分配，避免因Key路由错误导致写入失败；同时可配置主从复制，提升Redis读取可用性，间接保障查询稳定性。

🌟 让技术经验流动起来

▌▍▎▏ 你的每个互动都在为技术社区蓄能 ▏▎▍▌
✅ 点赞 → 让优质经验被更多人看见
📥 收藏 → 构建你的专属知识库
🔄 转发 → 与技术伙伴共享避坑指南

点赞 ➕ 收藏 ➕ 转发，助力更多小伙伴一起成长！💪

💌 深度连接：
点击「头像」→「+关注」
每周解锁：
🔥 一线架构实录｜ 💡 故障排查手册｜ 🚀 效能提升秘籍

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Flink与Redis集成：实现低延迟数据查询

集成核心价值：实时计算与内存存储的互补

集成核心原理：基于Connector的双向数据交互

核心场景与实践：Redis作为Flink Sink的落地

环境依赖准备

场景1：实时计数存储（哈希结构）

场景2：用户状态缓存（字符串结构）

数据一致性与基础优化

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Flink与Redis集成：实现低延迟数据查询

集成核心价值：实时计算与内存存储的互补

集成核心原理：基于Connector的双向数据交互

核心场景与实践：Redis作为Flink Sink的落地

环境依赖准备

场景1：实时计数存储（哈希结构）

场景2：用户状态缓存（字符串结构）

数据一致性与基础优化

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品