【即将重磅发布】华为云DWS上线AI数仓能力,持续引领融合分析新范式!

举报
wo华哒哒 发表于 2026/01/06 14:53:30 2026/01/06
【摘要】 近日,华为云DWS即将发布9.1.1.210版本,提供Data for AI融合分析能力。新版本集成MCP协议,支持向量检索、AI Function,可提供一站式OLAP分析、点查、全文检索、库内推理和AI推理等融合分析能力,重塑企业智能应用开发新范式,让数据工程师更加方便地使用AI,从而实现数据价值最大化,为企业客户提供更加实时、智能、高效的决策支持。

导语

正如OpenAI CEO Sam Altman所言“2024年以前,AI大模型领域尚处在探索期,更多面向开发者参与。2025年随着推理模型和垂域模型能力提升突破拐点,当前开始进入企业级AI时代”。随着推理模型和垂域能力的突破,AI正从开发者工具演变成企业核心生产力。在数据智能催生的产业变革里,打造AI-Ready数据资产将成为企业对数仓平台新的技术诉求。而数据基础设施的战略定位正在被重新定义——从被动存储走向主动智能,从批量分析走向实时推理,从结构化处理走向多模态融合。

传统数据仓库面临三重挑战:多引擎架构带来的数据冗余与运维负担、AI与数据平台割裂导致的开发效率低下、非结构化数据价值难以充分释放。企业需要的不再仅是“更快的查询引擎”,而是能够理解、推理并创造价值的“智能数据伙伴”。

近日,华为云DWS即将发布9.1.1.210版本,提供Data for AI融合分析能力,集成MCP协议,支持一站式OLAP分析、点查、全文检索、库内推理和AI推理等融合分析能力,重塑企业智能应用开发新范式,让数据工程师更加方便地使用AI,从而实现数据价值最大化,为企业客户提供更加实时、智能、高效的决策支持。

为什么企业需要AI原生数据仓库?

传统融合分析架构依赖多引擎协同:ES处理全文检索、Milvus负责向量检索、Doris专注OLAP分析场景等等。该架构存在显著痛点:

  • 存储冗余:数据在各引擎间重复存储,资源利用率低下
  • 运维复杂:多系统独立维护,故障定位与性能调优困难
  • 开发低效:数据格式转换与链路适配消耗大量研发资源
  • 实时性不足:批量数据流转难以满足AI应用毫秒级响应需求
    传统多引擎融合分析与DWS一站式融合分析对比

DWS提供的AI原生的一站式分析引擎,极大地简化原有多引擎协同分析架构,集成MCP协议打通与大模型平台的交互通道,集成向量检索能力,内置AI Function支持大模型调用,实现端到端的库内推理,从而构筑AI-Ready数据分析基础设施,消除数据孤岛,同时,通过基于binlog的物化视图实现流批一体增量计算能力,面向开发者提供声明式Pipeline加工新范式,实现近实时分析,整体架构更加简化、轻量,极大提高开发效率,降低运维管理难度,满足企业AI平台部署一站式多模态融合分析的核心诉求。

四大核心能力

1. MCP协议原生集成:打通AI生态的“神经网络”

MCP(Model Context Protocol,模型上下文协议) 是由 Anthropic 推出的一种开放标准,即”AI的USB-C“,旨在统一大模型与外部数据源和工具之间的通信协议,从而解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题,MCP 使得 AI 应用能够安全地访问和操作本地及远程数据,为 AI 应用提供了连接万物的接口。 
DWS支持对接MCP协议,一键式可配置,即插即用。通过标准化协议接口,企业可无缝接入Claude、Cursor等主流AI平台,内置8个常用的数据分析与运维监控类型API,真正实现“万物互联,开箱即用”。

产品文档:MCP Server

最佳实践:基于DWS MCP Server搭建数据分析Agent

2. AI Function:可插拔式的库内AI推理

DWS集成开源社区插件pgai,支持对接外部开源大模型、华为云Maas服务等,通过库内SQL方式调用大模型进行推理,提供文本分析(ai.classify)、向量化(ai.embed)、文本摘要(ai.summarize),情感分析(ai.sentiment)等24个AI Function,将大模型推理能力下沉至数据库内核,从而为企业客户提供更加智能化的数据分析服务,实现数据即推理、即处理的全新操作模式,助力企业快速获取洞察,提升决策质量和效率。

产品文档:库内推理

最佳实践:基于DWS构建RAG框架生成行业调研报告

3. 向量计算:非结构化分析的“水电煤”

企业80%的数据都是文档、图像、音视频等非结构化数据,过去是数据挖掘的暗区,其数据价值长期被低估,多模态统一向量存储和表示,使得多模态的检索不再困难。
DWS深度集成开源社区插件pgvector,实现分布式架构的改造,支持向量数据类型,支持IVFFlat、HNSW索引结构,支持相似度计算、最近邻搜索等多种高阶算法,实现基本的向量检索能力。

产品文档:向量计算

最佳实践:基于DWS的向量计算功能实现简单的商品搜索推荐系统

4. 内置大模型特征算子:赋予用户AI分析”无限创造力“

通过PL/Python扩展支持,内置32个自研扁鹊大模型算子,将Python数据科学生态完整引入SQL工作流。开发者可直接在库内运行复杂AI算法,消除跨系统数据流转开销,实现从特征工程到模型推理的端到端闭环。

产品文档: 大模型特征算子

DWS AI数仓能给客户带来哪些价值?

场景1. 零售行业:实时运营、智能选品及精准营销三位一体,提升消费者体验

  • 客户痛点
  1. 传统数仓仅存储交易订单、会员信息等结构化数据,无法分析用户浏览日志、商品评价、直播弹幕等非结构化数据。
  2. 离线分析无法支撑实时促销决策。比如,直播间某商品爆火,无法快速调整库存和定价。
  3. 用户画像以规则化标签为主,无法基于语义推理从商品评价、直播弹幕等挖掘用户真实槽点或诉求。

  • 业务价值创造
  1. 在线报表:支持年、月、周、日度报表的高效生成,统计商品类目信息、销量情况等,助力客户日常经营决策。
  2. 实时运营:对接直播销售渠道,实时采集某商品评价负向情感占比超30%,自动触发预警,运营人员随机调整话术或发放优惠券。
  3. 智能选品:结合"销量数据+评价情感+相似商品热度",筛选高潜商品,指导采购决策。
  4. 精准营销:结合用户画像,向“高复购+评价提到’送礼’”的用户,推送礼盒装商品优惠券。

场景2. 制造行业:以设备-工艺-质量联动,助力实时决策与品质提升

  • 客户痛点
  1. 设备IoT数据、工艺参数表、质检报告分析存在不同系统(IoT平台、ERP、MES),跨系统分析存在冗余数据同步;
  2. 质量缺陷分析依赖人工经验,无法快速定位“设备参数异常-工艺偏差-缺陷产生”等关联关系;
  3. 离线分析无法支撑实时工艺调整,比如,某台设备振动值超标,无法即时预警避免批量次品。
  • 业务价值创造
  1. 流批一体:IoT设备数据实时入库,并定期做批量增删改操作。离线计算历史工艺参数与缺陷率的关联规则,实时监控IoT数据,当参数偏离最优区间时触发预警。
  2. 质量溯源:输入某批次次品编号,一键查询”生产设备IoT数据+工艺参数+质检记录“,快速定位缺陷根因。
  3. 预测性维护:基于设备传感器数据和历史故障记录,预测设备故障概率,提前安排维保,减少停机时间。
  4. 工艺优化:SQL统计分析不同工艺参数组合的合格率,回归算法建模“温度-压力-合格率”的关系,输出最优工艺参数区间,将产品合格率提升5%-10%。

场景3. 金融行业:交易-行为-舆情联动,构筑金融风控实时决策新防线

  • 客户痛点
  1. 传统风控仅依赖交易数据(金额、时间、商户),无法识别"异常行为-舆情风险",比如,用户账户被盗后,交易金额正常但登录设备异常。
  2. 规则引擎无法应对新型手段,比如,“羊毛党”通过批量注册账号,模拟正常行为薅羊毛。
  3. 舆情风险(如某企业被曝财务造假)无法实时同步到风控体系,导致信贷决策滞后。
  • 业务价值创造
  1. 实时风控:交易发生时,实时完成多维度风险评估(含账户、设备异常),拦截盗刷、羊毛党等欺诈行为,降低损失率。
  2. 实时反欺诈:实时筛选分析“单笔交易大于5万+月交易次数骤增10倍”的用户,向量检索匹配用户行为与欺诈样本相似度。
  3. 信贷智能决策:向企业发放贷款前,结合“财务数据+舆情风险+行业趋势”等,输出信贷额度和利率建议。
  4. 舆情风险预警:当企业被曝负面新闻时,自动标记相关信贷客户,启动风险排查流程。

场景4. 政务行业:智慧城市一体化建设,驱动城市智能化管理升级

  • 客户痛点
  1. 政务数据分散在各部门,数据格式不统一,难以支撑跨部门协同分析。
  2. 民生反馈(如市长热线、政务APP留言等)多为非结构化文本,无法量化分析居民诉求。
  3. 城市治理依赖人工巡检,无法实时响应突发问题。
  • 业务价值创造
  1. 智能交通调度:结合时空和实时车流数据,动态生成交通拥堵热力图,智能推荐疏导线路,早晚高峰时段,实时调整红绿灯配时,缓解交通拥堵。
  2. 民生诉求精准响应:根据居民诉求的语义分类和区域分布,优先调配资源解决高频问题。
  3. 突发公共事件预警:当监测到积水超标+强降雨预警,自动触发防汛响应,输出防汛预案建议,辅助相关职能部门应急决策。

展望

历经十余年技术深耕和沉淀,华为云DWS数据仓库服务已完成三次关键跃迁:从2.0时代以存算一体架构筑牢数据底座,到3.0时代存算分离架构的颠覆性升级,再到如今5.0时代融合AI技术构筑AI-Ready数仓底座,始终以“打造智能数据时代融合分析平台”为使命,构筑覆盖全场景、多样化、智能化的数据分析能力。迄今已服务全球超1700家企业客户,在金融、政企、互联网等关键领域支撑起大规模数据决策。
迈入AI驱动的产业变革新阶段,DWS将持续聚焦三大核心方向:

  • 融合分析性能加速:非结构化、时空数据、全文检索等执行引擎持续优化,提升全数据类型融合分析效率。
  • 统一开放的格式:全面拥抱开源表格式,引入非结构化格式Lance,打破私有格式壁垒,降低数据使用门槛,真正实现“数据不动,计算流动”的 开放架构。
  • 智能体基础设施:为企业Agent应用、AI工作流提供高可靠、高性能、易集成、可扩展的数据底座。

我们相信,华为云DWS将继续扎根行业真实需求,以持续进化的平台能力,助力每一家企业构建属于自已的数据智能核心,持续引领数智时代融合分析新范式,在AI时代创造可持续的竞争优势。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。