CNCC2020大数据专场-大数据治理的全景式框架研究与实践

标签:无 1407人阅读 评论(0)

CNCC2020大数据专场大数据治理与开放共享论坛


大数据治理的全景式框架研究与实践

报告人:印鉴

中山大学人工智能学院

广东省大数据分析与处理重点实验室


大数据治理成为国家战略,习总书记指出“要运用大数据提升国家国家治理现代化水平,要建健全大数据辅助科学决策和社会治理的机制,推进政府管理和社会治理模式创新,实现政府决策科学化、社会治理精准化、公共服务高效化”。通过大数据治理提升政府治理水平,有三个方面:服务便捷化、政府决策科学化、社会治理精准化。通过大数据赋能政府治理,包括政府部门对群众提供管理服务,群众对政府的接受、监督管理服务。


大数据治理是一个复杂问题,包含两个维度,管理维度和技术维度,管理维度主要强调数据治理的流程,技术维度主要强调通过大数据赋能,大数据治理中需综合考虑两个维度。

如果只从一个维度片面考虑问题,无法深入研究管理维度和大数据技术维度间的交织关系。不应对大数据治理片面理解,若只考虑大数据赋能,则大数据存储、分析技术研究难以直接应用到复杂的实际问题中。若只考虑治理流程,则可以出现不了解技术现状,容易产生好高骛远、难以实现的问题。因此,提出一个综合考虑大数据赋能和治理流程两个维度的大数据治理框架。


数据治理流程主要有以下三个阶段:

1. 方案:针对现实生活中的问题制定方针、决策或者政策

2. 实施:具体实践对应的决策方案

3. 评估:对实施结果和预期目标进行比对和分析

针对上述三个阶段,通过大数据赋能,在设计方案阶段,采集公众多维度的数据,基于“众智”获得更具执行效益的民主方案;在实施阶段,通过共建共享公用,构建了统一的信息平台,实现精细化、人性化、个性化和高效化;在评估阶段,评估主体从“人控”转为“技控”,得到评价的独立性、科学性、权威性、公正性和客观性。


大数据赋能的维度包括数据基础,数据服务和数据生态。数据基础指对原始数据进行采集、加工以及存储的软硬件设施。数据服务提供数据传输、数据处理(包括计算、分析、可视化等)、数据交换等数据各种生存形态演变的一种信息技术驱动的服务。数据生态指对数据的开放与共享、互动与协同,数据生态使得数据变得透明可信,从而形成大数据感知、管理、分析与应用服务的新一代信息技术体系。

由此提出大数据治理的全景式框架,包括数据生态,数据服务,数据基础三个层面。


1.png


在实践方面,介绍深度学习支持的政府治理大数据分析与预测关键技术研究项目。项目主要分为数据拼图,可解释深度学习以及数据众智三个部分。


2.png


基于数据拼图的多模态政府治理大数据融合

单一的数据源已不能满足日益复杂问题的需求,需要统一的、全局的方法来进行数据感知和融合。通过结合图像、文本、视频等信息源还原事件全貌,实现基于数据拼图的全局数据感知。最终实现政府治理大数据的特征辨识、多源数据融合。

数据拼图通过呈现出一张完整的信息图,实现数据在更高层次上面的深度特征提取与语义描述方法。通过带记忆单元的网络实现增量数据抽取,图结构的数据融合实现多模态数据(文本、图像、视频)融合,带时间序列的数据融合实现数据拼图的构建。

具体技术方案:

(1)以带记忆单元的深度网络实现增长数据的迭代式抽取,实现数据清洗和消解避免信息炸和冗余:

(2)通过图结构完成对单模态数据关联规则的学习,以基于矩阵的分冶与合并的融合学习推断多模态数据的特征和隐藏关联:

(3)基于带时间序列的深度网络构建多层次、多粒度数据拼图的索引结构,支持高效的语义服务。


3.png


深度学习驱动的政府大数据分析与预测方法

在数据的分析过程中,输入数据直接得到结果,难以解释性问题使得为政府决策提供辅助变得困难。基于可解释深度学习的分析与预测,对政府大数据进行预测,构建具有可解释性的新型辅助平台,为决策提供依据。

(1)设计新型可解释的深度学习算法,以了解其学习过程并找到对预测结果起决定作用的因素;

(2)针对动态变化的政府治理大数据进行实时分析和精准预测。

使用可解释深度模型(近似推理,符号表示),通过在线时序深度模型进行在线实时处理,通过记忆机制网络集成得到治理目标精准预测。

具体技术方案:

(1)融合贝叶斯网络和符号强化学习构建可解释深度模型,通过贝叶斯推理避免学习黑箱;

(2)结合attention网路和概率图模型实现在线时序数据分析:

(3)通过引入记忆机制和集成学习思想设计新型深度增强网络,实现政府治理目标精准预测。



4.png


数据众智的决策与评估方法

政策的实施可能主观性比较强、没有充分发挥媒体、专家、利益群体和人民大众在决策和评估中的作用和智慧。基于数据众智的决策与评估,科学地进行多主体决策与评估。

数据众智利用数据充分发挥专家、媒体、利益群体和人民大众在决策和评估中的作用。使用情感分析深度网络建立情感分析模型,基于模糊推理的实时决策方法建立决策支持模型,结合数据众包模型最终形成混合政策评估模型。

具体技术方案:

(1)利用网络挖掘技术、文本分析和情感分析方法,深入挖掘“事件-情感-原因”的关系链;

(2)通过模型本体、数据本体、推理引擎来构造数据众智的决策支持模型;

(3)基于半监督深度学习的主题感情分析方法,构造数据众包模型的混合政策评估模型。


5.png


查看评论

暂无评论

发表评论
  • 评论内容:
      
首页
团队介绍
发展历史
组织结构
MESA大事记
新闻中心
通知
组内动态
科研成果
专利
论文
项目
获奖
软著
人才培养
MESA毕业生
MESA在读生
MESA员工
招贤纳士
走进MESA
学长分享
招聘通知
招生宣传
知识库
文章
地址:北京市朝阳区华严北里甲22号楼五层 | 邮编:100029
邮箱:nelist@iie.ac.cn
京ICP备15019404号-1