联系我们

Geega关注丨构建大数据治理体系,推进数据从资源向资产转化

2022-07-29 18:06:59

大数据是新时代的“数字宝矿”,是当今世界有价值的战略资源。随着社会经济发展态势的引导和大数据技术演进趋势的驱动,各大企业纷纷推动数智化转型升级。本文探讨中国移动在数智化进程中,如何构建大数据体系并推动数据管理战略向数智化全面升级,提升共享开放效率、赋能行业生态发展。

充分释放数据要素新动能

数据是数智化转型之根、数字经济之血脉。数据的产生从生产经营活动空间到实体物理空间,并进一步拓展到虚拟网络空间。粗略估计,一天中,早晨有近1亿用户看新闻刷微博,上午有近5亿用户使用通信软件,中午有近千万人通过APP点外卖,晚上有2亿多人网上购物、刷视频……

作为通信运营商的中国移动为“人民群众的24小时数字生活”提供了强力支撑,中国移动数据呈现出全客户覆盖、全方位洞察、全时空更新的特征。当前,中国移动大数据平台规模超4万个节点,日采集数据量超过4PB,日处理数据量数十PB,价值数据规模超300PB。

在大数据与社会、经济、生活深度融合的背景下,如何充分释放数据要素新动能成为中国移动大数据发挥价值的重要问题。中国移动以技术创新“强筋骨”,以数据治理“壮体格”,构建了完善的大数据治理体系,以数据价值萃取为“核”、以数据资产管控为“基”,以数据服务为“赢”、以数据交付为“上”、以技术创新为“力”,以数据安全为“盾”,推动数据从资源向资产转化。

萃取要素价值,筑造数据能力之基

充分萃取数据要素价值,是数据治理的核心,中国移动基于数据中台,面向各单位共建共享,共筑数据能力之基。数据中台融合了数据、工具、算法、算力、服务5种要素,通过抽取共性需求,将大数据中心汇聚的多源数据打造成可复用的数据资产,实现价值萃取。目前中国移动已形成“2+4”能力架构体系,提供工具和算法2类基础能力,可以形象地比喻为“厨具和菜谱”;以及4类核心数据能力,比喻为“食材”;在数据中台这个可复用共享的“厨房”里,这些元素按需组合,可以灵活满足大家打造“美食”的需求。

搭建“1+4+1”大数据治理框架

面向N类丰富的大数据资源、资产,中国移动形成了“1+4+1”大数据治理框架,建立了一套组织体系,横向拉通“集省专”、纵向贯通各层级。同时,中国移动还制定了一套制度体系,为数据管理提供坚实的制度依据,并围绕数据架构、数据标准、数据质量及数据安全,形成4个支柱能力,全面提升数据管理水平。

数据服务灵活多样,数据流通安全可信

数据能力的应用离不开服务能力的打造,中国移动数据中台提供“PaaS”“DaaS”和“SaaS”3类服务模式,支持不同场景、不同形态的数据能力需求。在这个过程中,通过打造全面可靠的数据安全底座,不仅实现了数据全生命周期的安全管理,对海量数据进行严格的脱敏、加密及安全审计,而且建立起多方安全计算平台,支持中国移动与外部合作伙伴进行可信数据融合处理,实现数据可用不可见。

6个统一,打造数据服务敏捷交付体系

数据流转的质量和效率是数据服务的核心保障,中国移动引入了DataOps敏捷数据运维的理念,通过数据、工具和人员的有机融合,实现数据持续交付和闭环运营。这套数据交付体系自下而上从6个阶段打造核心能力,支持多层次的深度治理,覆盖数据“采传存储用”全链路。

在采集阶段,从机制和平台两个层面保障数据汇通;在处理阶段,研发一站式流批融合处理新工具;在分析阶段,沉淀特征库,支持工具灵活编排,提升数据挖掘效率;在存储阶段,标记多维度业务标签,提升数据资产化水平;在应用阶段,编制企业级数据开放目录,便捷数据订阅和提供;在运营阶段,利用知识图谱技术深度挖掘资产关系,实现资产图谱化,盘活数据流转过程,形成高效的服务运营体系。

推进技术创新,加强核心能力自主管控

大数据平台是一个集成的数据开发平台,中国移动坚持技术创新驱动,大力推进大数据核心能力自主研发,增强业务发展中的主动权和掌控力;推进大数据工具标准化,沉淀标准化中台能力,统一大数据底座架构,打破普遍存在的平台能力联结问题,降低异构数据处理的复杂度,逐步解决大数据应用存在的问题。

搭建“1+X”特色隐私计算技术平台

随着数据科学、人工智能、云计算等技术的快速发展和应用,数据蕴含的信息和价值日益彰显。数据的核心价值在于连接和共享,数据通过跨业务、跨场景、跨行业的流通,样本量及维度进一步丰富,进而催生更多的应用场景。由于数据具有易删、易改、易复制等特性,不可避免形成数据泄露、数据滥用等安全隐患。

一方面,流通过程中机密数据和个人隐私存在泄露风险和安全隐患,加剧了监管机构、数据要素市场参与主体对数据流通的担忧;另一方面,现有监管条件下,业界仍没有形成明确统一的数据权属规则,在数据流通的链条中,如何确定数据的归属方、保证数据归属方的权益,尚待进一步形成共识。

在数据要素市场化进程中,隐私计算作为一种核心基础技术,能够帮助数据流通建立有序可控的共享机制,促进数据要素市场的蓬勃发展。隐私计算通过融合密码学、人工智能、安全硬件等跨学科技术体系,形成一套可以保障数据流通安全合规的基础设施。从应用目的上说,隐私计算实现了在数据流通过程中对国家安全、商业机密、个人隐私等敏感信息的保护,并且助力数据安全流通、释放数据价值。

在隐私计算技术的探索上,中国移动于2018年启动联邦学习研究与布局,开展联邦学习开源框架跟踪研究及试点实践。2019年到2020年间,中国移动在技术层面逐步深入开展联邦学习开源框架跟踪研究,重点涵盖联邦学习可信评测方法、框架碎片化等技术;在应用层面,开展试点实践,探索应用场景落地可行性并持续推进中国移动数据智能生态合作落地。

2021年,中国移动梧桐大数据正式发布具有“1+X”特色技术框架的隐私计算平台。该平台可在确保数据“可用不可见、可控可计量”的前提下,实现通信运营商与政府、企业等外部单位数据的安全流通。该平台有效支撑了包含电信诈骗识别、普惠金融在内的30余个应用场景,有力推动了行业数据要素融合、行业标准体系共建、安全可信生态打造的步伐。

不仅如此,中国移动在国务院国资委、工信部等相关部门的指导下,对内勇担重大项目“大规模分布式大数据计算与可信数据服务技术研发”;对外推进隐私计算技术能力“出海”,主导参与IEEE、TMF两项隐私计算国际标准制定,为央企海外数智化转型发展提供技术支持与智力支持。

产品、方案、生态一手抓,构建特色大数据价值生态

基于自身资源禀赋,中国移动以“数据为核、能力为基”为理念,全力构建“产品为上、方案为策、生态为赢”具有中国移动特色的大数据价值生态。

产品为上,打造拳头数据产品

中国移动规划建设“大数据+”产品体系,包括数据能力、行业集成、营销服务、智慧管理、平台工具以及模型算法六大类产品。

数据能力类产品以满足客户刚性需求为主,提供深加工服务能力。主要包括客户画像类、群体分析类等基础性产品,对内赋能智能决策及精准推送等场景,对外主要以API形式提供服务。

行业集成类产品是大数据产品的主战场。中国移动聚焦疫情防控、应急救灾、人口洞察、出行规划、商圈选址、景区分析等多个领域,面向政务、金融、新零售等多个行业,打造疫情大数据、人口大数据等多项大数据产品,为数智化转型注智赋能。

营销服务类产品主要面向互联网、汽车、金融等行业,为客户提供精准触达能力,实现广告精确投放、景区特色推荐以及新机唤醒等业务场景。

智慧管理类产品以全方位赋能企业运营为目标,助力企业财务、采购、审计等部门实现降本增效。

平台工具类产品为客户提供全面敏捷的储算、工具能力,目前已支持的工具能力超过50种,涵盖大数据采集、处理加工、可视化分析、安全运维等全流程大数据服务。

模型算法类产品的核心是打造多场景数据图谱,为客户提供语义分析、用户偏好识别、金融风控、客户维系等多种模型能力,助力企业实现精细化运营。

方案为策,提供融合解决方案

“大数据+”方案体系以大数据为基础,结合人工智能、区块链、5G、物联网以及云计算等技术,输出DICT融合解决方案。

生态为赢,布局全景合作生态

为充分发挥数据要素价值,促进中国移动大数据与千行百业融合发展,中国移动在2021年智慧中台生态创新发展论坛上正式发布了“梧桐引凤”计划。该计划以梧桐大数据平台为基石,通过三大开放举措,正式启动了大数据生态合作。

一是开放平台。梧桐生态合作平台将为合作伙伴提供产品孵化、脱敏数据、产品部署运行环境、运营服务保障及标准化创新探索空间等一站式服务。

二是开放生态。面向行业合作伙伴,开放商业合作,探索联合研发、合作引入等新模式,不断壮大开放合作的“亲戚圈”“生态圈”,与合作伙伴和合共生。面向高校及研发机构,降低创新创业门槛,提供创意孵化,打造技术社区,设置创投激励。通过“梧桐杯”大数据应用创新大赛,向高校学子提供创新导师、现金奖励、招聘直通、创投孵化助力等全面支持,持续推动“产学研用”融合和成果转化应用,为大数据产业发掘和聚合人才。

三是开放门户。梧桐大数据统一门户展示涵盖了产品目录、数据目录、合作模式及自服务案例,合作伙伴通过登录门户可申请使用服务,从而实现了“产品订购入口、生态合作入口、技术分享入口”的统一。

肩负国企责任,“用数赋智”助力数智生活发展

中国移动作为国家电信运营企业,在社会数智化转型进程中承担着国计民生的责任。中国移动依托梧桐大数据平台“筑巢引凤”,在防疫、民生、普惠金融领域也积极推进“用数赋智”,助力数智生活发展。

快速响应,赋能高效防疫

新冠肺炎疫情发生以来,基于大数据的追踪溯源和健康码识别,为有效控制疫情和复产复工作出重要贡献。中国移动以全网数据为基础,构建“全国趋势总览、省市态势监测、区县深度分析、街乡精细管理、社区防疫辅助”五级疫情防控产品体系,逐层下沉,形成疫情管理闭环联动。截至今年4月底,移动行程码累计查询量达327.72亿次。

聚焦民生,支撑社会治理

社会服务领域的数字化能力提升,是当前各级政务重点关注的领域。中国移动与交通、应急、人口、人社、城市规划等各部门开展深入合作,将海量数据资源和大数据能力嵌入政务、民生服务的多个环节,充分提升服务效率和质量。例如从社保人员信息、地理位置等四大场景29个指标判别就业人员,累计为乡村振兴创收达3.2亿元;打造应急管理应用,累计受益人口超1500万。

防范风险,助力普惠金融

金融风控大数据产品是一套完整的依托海量数据处理和人工智能算法的风控产品,充分发挥与生活息息相关的运营商数据价值,为用户提供验真、风控标签、联合建模等多种金融风控服务,开启普惠金融新时代,其中验真类服务查询已超13亿次。中国移动信用分从五大维度、近80个标签真实反映客户信用风险,累计服务162亿次。

中国移动大数据构建数据治理体系、数据中台,通过“内治外促”双循环,推动数据资产价值全面释放,加强生态合作,促进核心能力提升、关键领域卡位、价值收益贡献。引入数据、工具、软件、解决方案、咨询等能力,对内快速构建亟需的技术能力,补齐技术短板,缩短研发周期;对外聚焦政务、金融、交通、教育、工业、农业、商贸等垂直行业需求,跨越市场壁垒,打造行业示范标杆。

来源:通信世界