政务大数据,释放数据资源价值,激活数字政府潜能
来源:华为公司 作者:周春燕
政策与技术双轮驱动,政务大数据建设正当其时
《国家数据资源调查报告(2021)》显示,2021年我国数据产量达到6.6ZB,同比增加29.4%,占全球数据总产量9.9%,仅次于美国(16ZB),位列全球第二;其中政府数据产量最大,其次是互联网、金融。同时政府数据涉及城市运行管理、政务服务、社会公共服务、经济监管等社会、生活、经济方方面面,不仅规模大,同时含金量高,可以在公共安全应急保障、城市生活服务类应用、提升金融风控和定价、服务产业经济发展、优化资源配置等方面发挥重大作用。在我国从“数据大国”走向“数据强国”的发展道路上,政府对全社会数据资源价值释放的推进责任重大,肩负“数据要素市场化配置”推动者、“数据主权/数据安全”监管者、“公共数据资源”提供者、“城市融合数据资源”使用者四大职责。
党中央、国务院高度重视政务大数据体系建设。为深入贯彻落实党中央、国务院关于加强数字政府建设、加快推进全国一体化政务大数据体系建设的决策部署,《全国一体化政务大数据体系建设指南》经国务院同意,由国务院办公厅2022年10月印发。按照建设指南要求,加强数据汇聚融合、共享开放和开发利用,促进数据依法有序流动,结合实际统筹推动本地区本部门政务数据平台建设,积极开展政务大数据体系相关体制机制和应用服务创新,增强数字政府效能,营造良好数字生态,不断提高政府管理水平和服务效能,为推进国家治理体系和治理能力现代化提供有力支撑。《全国一体化政务大数据体系建设指南》作为国家最新的政府信息化纲领性文件,对政务大数据建设目标、国家-省-市县总体架构、八大主要任务、四项保障措施做出明确定义和要求,到2023年底前,全国一体化政务大数据体系初步形成,基本具备数据目录管理、数据归集、数据治理、大数据分析、安全防护等能力,全面摸清政务数据资源底数,建立政务数据目录动态更新机制,政务数据质量不断改善,管理机制、标准规范、安全保障体系初步建立,基础设施保障能力持续提升。
除政策驱动,不断涌现的大数据技术创新、技术升级也在带动政务大数据的快速发展,如科技抗疫场景,基于全分布式技术实现流调报告从2小时缩短到30分钟,疫情从源头快速管控;海关仓检场景,基于流批一体技术提供秒级风控计算能力,支撑大额货物贸易、跨境电商等业务实时通关;公共数据开放场景,基于政务区块链和隐私计算技术实现数据“可用不可见”,促进价值数据流通的同时保护数据隐私与数据安全。作为中国数字政府大数据管理平台市场领导者,2022年华为云在IDC大数据相关市场份额报告中第四次取得第一,在“云原生”、“湖仓一体”、“数智融合”、“全链路数据治理”、“分级分类数据安全”、“一站式高性能交互式引擎”、“可信智能计算”等技术方向上不断突破,为政务大数据提供强智能、高性能、高安全、易扩展。
政务大数据是体系化工程,需从6个方面3个阶段2种模式1个顶层设计入手
政务大数据核心要解决好政务数据资源“盘得清、管得住、用得好”的问题,盘得清,即做到摸清数据家底,全量目录梳理,按需数据归集,全面数据治理,实现多源整合;管得住,即做到统一数据供需对接,数据按部门职能、安全合规得共享及开放使用;用得好,即做到丰富的数据对象、数据模型、数据接口、数据分析能力供应用及业务分析人员、数据开发人员、数据分析师、数据官等不同角色按需调用;政务大数据整体需要从平台、数据、管理、运营、应用、市场六个方面系统化构建。
以“打破数据壁垒”的热点问题为例,首要是建立数据供需管理机制,打开数据供给,明确数据适配投入,如由数据管理部门承接公共的数据适配,由数据需求方承接定制的数据适配;其次是引入最新平台技术,创新解决方案,如“逻辑数据湖”平台支持逻辑全量接入、物理按需汇聚,“可信智能计算”平台支持数据可用不可见;最后是建立运营机制,由专业团队负责因地制宜制定策略并进行落实。
按照全国经验,政务大数据建设分为三个阶段和两种模式。三个阶段对应政务大数据逐步深化的推进程度,阶段1仅建设数据共享交换平台和目录体系,提供管道式数据共享通路,未对数据进行统一归集和治理,不少地区处于阶段1;阶段2由数据分散走向数据融合,由政务大数据实现数据归集、按需治理、赋能应用,部分先进地区处于阶段2;阶段3由平台分散走向集约化共建,由政务大数据提供统一大数据平台、统一数据湖、统一数据服务,部分领先地区处于阶段3。
两种模式对应政务大数据初始建设方式,模式1为自下而上的“平台驱动”,即数据管理部门主导,建设政务大数据平台、构建数据资源体系,建设城市运行指挥中心(简称城市IOC)支持城市运行数据可视、辅助科学决策;模式2为自上而下的“应用驱动”,如“一网统管”、“市域治理现代化”等跨部门应用,即业务部门和数据管理部门共同主导,建设政务大数据平台、数据资源体系及对应智慧应用。
每个地区的政务大数据建设需基于自身基础、发展诉求、业务环境选定建设阶段和建设模式,对平台、数据、管理、运营、应用、市场进行规划,形成整体顶层设计,牵引指导政务大数据体系化构建、逐步迭代,从而释放数据资源价值,激活数字政府潜能,带动数字社会、数字经济、数字城市、数字生态发展,形成本地数智品牌。
平台作为发展基石,重点是安全可控、模块搭建、技术演进
政务大数据存储管理数字政府大量数据,平台安全、可靠和自主可控是第一位,安全包括网络安全、系统安全、数据安全,整体做到非法攻击“进不来、看不懂、改不了、丢不了、拿不走、走不脱”;可靠包括关键业务不中断、非关键业务按需快速恢复,数据可进行故障接管及故障恢复;可控包括技术和数据的双重自主可控,不存在技术卡脖子风险、数据不会被非法变现使用。
政务大数据技术除了已经被广泛使用的分布式计算存储、分布式并行数据库、数据共享交换、数据集成、流计算、数仓分析等,大数据作为学界和业界最为活跃的技术领域之一,还有源源不断的技术创新、技术迭代,如湖仓一体、跨云数据管理、Data Fabric(数据编织架构,跨平台数据整合自助编排)、DataOps(数据运营体系)等等,以及人工智能及隐私技术与大数据相互融合产生的大量新技术。因此要求政务大数据平台在建设时必须具备模块化搭建能力,支持模块化升级、模块化替换,非技术升级必要不影响其他模块;同时服务商必须具备深厚的技术投入及演进能力,支持政务大数据平台长远发展,保护政府投资。
数据作为核心动力,重点是数据归集、数据治理、数智融合
政务大数据归集数字政府各部门原始数据,通过数据治理形成标准化、高质量数据资产,基于大数据分析和AI技术产生更多高价值数据,形成各种基础库、主题库、专题库和数据产品供内外部智慧应用调用。
针对当前政务大数据“数据资源体系”建设中遇到的“数据返还难”的问题,11月国务院办公厅引发通知,在贵州、吉林、上海、浙江、安徽、山东等6省市开展数据直达基层试点,依托全国一体化政务数据共享枢纽开展国家数据共享平台与省级政务数据共享平台“总对总”对接,推动国家层面政务数据向基层使用部门共享、赋能基层。同时针对“数据底数不清、跨部门数据拿不到、数据质量不足”的问题,需要从管理机制和技术平台两方面配套解决,破解部门对管控权、投入及风险承担、数据质量等方面的顾虑,技术平台支持多种异构数据源灵活的数据归集及多维度质量检测的数据治理。
管理作为方向把控,重点是稳健规划、健全机制、夯实规范
由于政务大数据的战略重要性、技术以及跨部门协同复杂性,首先需要成立专项领导小组和配套专班,由地区领导班子挂帅,把握本地区政务大数据建设与运营的方向、计划、资金预算、进度进展、相关重大决策,加强组织实施;其次通过制度建设明确数据主管部门的责权事项、明确对数据主管部门及各委办局的绩效评估评价,强化督促落实,鼓励探索创新;最后由数据主管部门牵头制定资源目录编制、数据归集、数据集成治理、数据模型及接口设计、数据共享交换、公共数据开放、数据安全等相关标准规范,规范流程与实施质量。
运营作为运行保障,重点是专业团队、专业人才、专业经验
政务大数据不断有新数据和新需求产生,运营体系需要承接供需对接,对数据目录、数据共享、数据资源库、数据治理、数据分析、数据开放、政务数据服务门户持续进行构建、完善、增强,按照《全国一体化政务大数据体系建设指南》“管运适度分离”原则,建设专业团队、培养及引进专业人才、引入政务大数据服务商专业能力及全国经验,建立健全政务数据运营规则,明确运营机构的安全主体责任,研究制定政务数据授权运营管理办法,强化授权场景、授权范围和运营安全监督管理。
应用作为价值呈现,重点是有序创新、打造特色、构建生态
目前全国已有不少政务大数据成功实践,如利用大数据加强经济监测分析、提升研判能力,通过数据共享减轻企业申报负担、提升市场监管能力,城市运营“一网统管”、政务服务“一网通办”、社会信用体系建设、普惠金融、智慧生态环保、智慧疫情防控等,同时发达地区继续加快在城市治理、环境保护、生态建设、交通运输、食品安全、金融服务、产业发展、社会救助、公共卫生、应急处突等应用场景的大数据创新。建议欠发达地区一方面引入已有成功实践,另一方面结合本地特色需求进行应用创新。同时建议各地区成立“政务大数据联合应用创新中心”,聚合大数据服务商、应用服务商、本地科技企业和本地高校资源,共建本地政务大数据生态。
市场作为流通载体,重点是上线系统,建立规则、发展数商
目前贵州贵阳、北京、上海、广州、深圳已在数据交易市场为全国探索了很多经验教训,如贵阳制定《数据要素流通交易规则》《数据产品成本评估指引》《数据交易合规性审查》《数据流通平台运营管理办法》等应对数据确权难、定价难、市场交易主体互信难、入场难、监管难等一系列问题;上海通过系统技术手段对交易进行全程监控,采用“市场化”市场主体依法自主定价,发展数商体系,挖掘培育包括数据经纪、合规审查、资产评估、数据交付在内的中间机构,健全丰富数据要素市场体系。
“规模”是市场的重要衡量指标,数据交易未来会走向全国统一大市场,建议发达地区勇于创新实践,欠发达地区初期以省为单位打造数据要素市场,地市以专区形式挂载,后续按需进行市场下沉。
华为云政务大数据助力省市区县构建数智引擎、数智协同,打造区域数智标杆
华为云政务大数据解决方案采用1+3+5架构,即1套平台、“数据资源、共享开放、应用支撑”3中心、“标准规范、安全保障、运维监控、运营支撑、集成支持”5体系,整合2012实验室最新技术研究成果、华为云最新大数据云服务、华为自身IT数字化转型数据之道及全球政企大数据项目实施经验,保持理念、技术、产品和工程的先进性、可交付性及可持续演进,如支持批、流、交互式多引擎融合分析,统一资源调度,资源利用率90%+;支持2万+节点超大规模集群,支持集群联邦最大10万+;在线滚动升级,服务永新,两地三中心高可靠等。华为云政务大数据解决方案具体实施时,将基于地区自身进展和发展诉求,协助进行顶层设计规划,分阶段有序构建数智引擎、数智协同,创新数智应用,助力省市区县政务大数据从数据供给侧“扩源”、数据需求侧“扩面”、大数据体系“扩能”,释放数据资源价值,激活数字政府潜能,形成特色品牌和区域标杆。
华为云政务大数据四大核心能力具体包括:
MRS云原生数据湖,一个架构可构建逻辑、实时、离线三种数据湖,提供湖仓一体、云原生的大数据解决方案。逻辑数据湖支持跨湖、跨仓、跨云协同提效30%+;实时数据湖支持毫秒级OLAP,时效性从T+1到T+0;离线数据湖支持湖内建仓,缩短分析链路,分析提效10倍+。云原生数据湖支持资源弹性发放,业务按需扩缩容,发放由数天缩短至数分钟;统一元数据管理,数据全局可视;支持存算分离,基于自研企业级EC,计算存储成本更优,TCO下降30%+。
DWS云数据仓库,具备分析及混合负载能力的分布式数据仓库,提供PB级数据分析、多模分析和实时处理,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景。
DGC数据治理,数据全生命周期一站式数据治理与管控平台,全方位的数据探索稽查和分析,实现多源数据清洗、标准化和主题联接,生成标准、清洁的数据,支持行业知识库智能化建设,帮助客户快速构建数据运营能力。
ROMA数据集成与开放,跨越复杂网络汇聚多源数据,通过部署Agent可管理传统IDC机房、政务云及边缘等多种节点,打通云上云下政府应用、数据、设备之间信息孤岛;将大数据平台中各种数据直接开放为Restful API供业务系统直接调用,简化数据开放。
目前,华为云政务大数据在全国已有600+项目实践,市场份额第一。典型案例如某省政务大数据,形成国家、省、市三级互联互通的共享交换平台体系,建立汇聚库、中心库、基础库、主题库、专题库等重要政务资源信息库,形成数据集成、治理、挖掘、应用、安全等全流程服务体系;某市政务大数据,构建全市数据资源体系,实现全市数据汇聚、治理、应用、共享、开放及大数据基础资源的全面监控管理,成为数字政府重要抓手,支撑科技抗疫。未来,华为云政务大数据将围绕技术、应用、方法、模式持续创新持续构建,助力数字政府、数字中国发展。
- 点赞
- 收藏
- 关注作者
评论(0)