基于总线结构的政务数据共享应用模型研究
2019-06-03 16:17:26 浏览:12464 来源:电子政务智库
[目的/意义]随着电子政务的发展, 政府部门协作日趋频繁, 政务数据共享成为必然趋势。传统的政务数据共享方式主要基于统一的数据中心, 然而这种模式未能充分考虑部门权限、安全性等因素, 使得政务数据共享仍然困难重重。[方法/过程]本文提出了一种基于总线结构的政务数据共享应用模型, 模型使用统一的数据、接口、资源目录标准以及自主访问控制和权限管理模型, 以期为政务数据共享提供支持。[结果/结论]相对传统的政务数据共享模型, 该模型灵活的权限管理和统一的标准既可以较好地保障数据安全又能防止利益冲突造成的信息壁垒, 同时又可以大大降低共享的资金、人力和时间成本。
随着电子政务的发展, 政府部门协作日趋频繁, 其中伴随着大量的数据交换。然而随着互联网的高速发展, 政务数据量激增, 频繁的数据交换需要花费大量的时间成本, 因此政务数据共享成为一种必然趋势。政务数据共享具有重要的作用和意义, 一方面, 它可以促进政府管理的科学、高效, 促进国民经济的发展;另一方面, 它可以解决当前政务数据存在的诸多问题。
当前的政务数据共享主要面临着三大难题:其一, 部门间形成信息壁垒。由于行政管理体制问题, 政府部门间相互独立, 形成信息壁垒。这使得政务数据存在重复收集与建设的现象, 严重浪费人力、物力、财力, 同时也使得大量数据信息资源难以开发利用, 其真正价值难以得到充分发挥。其二, 部门系统缺乏统一的标准体系。政府部门数据库缺乏标准体系的支撑, 使得数据格式、元数据标准不一致, 采取的处理技术、应用平台各异, 数据接口也不互通, 数据共享困难。最后, 政务数据存在安全和保密问题。政务信息涉及大量公民隐私和部门秘密, 如果不适当公开会带来严重后果。
目前政务数据共享的主要方式是搭建大数据中心, 然而该方式需耗费大量的时间和资金成本, 同时各部门对保密问题和利益安全问题的担忧影响了信息共享真正实施。
本文提出了一种基于总线结构的政府数据共享应用模型 (BODSAM:Bus-based Government Data Sharing Application Model) , 该模型主要从系统标准化和自主权限管理两方面实现部门间的政务数据共享。相较传统模型, 该模型可以保障数据安全和部门利益, 有利于政务数据共享的推进, 同时又可以大大降低实施资金、人力和时间成本。
1 政务数据共享模型研究现状
关于政务数据共享模型的研究, 国内外已有很多研究成果, 研究内容主要包括数据标准化问题、数据分散问题、数据安全和部门利益问题、共享激励问题等。
1) 为解决数据标准化问题, Bajaj A等提出了一种基于XML的信息共享模型, 该模型可以很方便地定义需要共享的信息结构, 便于信息维护;刘密霞等详细阐述了信息资源共享标准化的方法——顶层设计架构, 并基于此提出了政务信息共享的发展思路;林智华利用XML技术和WebService技术, 提出了异构政务数据源共享的框架, 该框架由信息源层、XML中间件层、接口层和应用层4个层次组成。
2) 为解决数据分散问题, Bhandari G等采用中间件技术整合异构数据, 并利用云技术构建政务云平台实现共享;李晓东等采用基于企业服务总线的方式整合异构系统;李卫东指出建立公共数据中心是实现政务信息资源共享的有效模式;赵贤提出可以通过数据仓库技术, 实现政务数据的规范管理和汇集共享。
3) 为解决数据集成后的分类管理问题, 徐敬提出基于用户对象和业务需求建立信息分类数据库从而实现分类管理, 赵文晶提出基于目录体系实现资源统一管理。
4) 为解决数据安全和部门利益问题, Liu P等提出了一个基于安全利益的信息共享信用模型, 该模型通过集成一系列信息共享策略, 保护联邦政府信息共享时各部门利益和信息安全;涂平等提出了基于PKI/CA技术实现信息安全的策略;洪光宗等从访问权限控制的角度, 探讨了如何解决政务数据共享与政府保密制度之间的矛盾;高国伟等基于区块链技术提出了一种信用性好、安全性高、透明性强、可拓展性好的政务数据共享模式。
5) 为解决政府部门在政务共享时积极性不高的问题, Makedon F等提出了一种“安全内容交换谈判系统”的共享模型, 该模型使得政府部门可以通过谈判就共享条件达成协议, 从而促进信息共享;高锡荣提出了一种信息共享激励机制模型, 通过采取正激励措施和负激励措施诱导政府部门进行信息共享;樊博提出可以通过绩效管理作为政府信息共享的驱动力;聂勇浩提出通过降低交易费用, 促进政府部门信息共享。
此外, 还有一些学者从知识管理、业务协同、信息链、云计算等角度对政务数据共享的实现进行了探讨。
综上所述, 国内外学者在政务数据共享模型研究方面已经有很多成果, 但大多研究都侧重解决单一问题, 鲜有对数据标准化问题和数据安全问题的综合研究。此外实现政务数据共享的基本思想大都是构建统一的大数据中心, 实施成本较高, 且很多部门因为利益保护和安全性考虑, 数据共享的积极性不高。
针对上述问题, 本文提出了一种基于总线结构的政务数据共享模型, 该模型具有全员互联互通、权限自主管控、物理上分散、逻辑上统一等特点, 与传统的政务数据共享模型相比, 该模型大大降低了实施成本, 并且较好地解决了数据标准化问题以及数据安全问题, 实现了部门间的互联互通, 同时不需要考虑数据一致性问题, 有利于政务数据共享的推进。
2 总线结构介绍
总线结构概念最早源于计算机组织, 之后在计算机网络和数据仓库中也有总线结构的定义。
计算机组织是指建立计算机各功能部件 (CPU、存储器、输入输出设备等) 的相互连接和相互作用, 从而实现有效的信息传输。计算机组织的互联方式包括以CPU为中心、以存储器为中心和总线3种方式。如图1所示, 总线是CPU、内存、输入、输出设备传递信息的公用通道, 它是由导线组成的传输线束, 主机的各个部件通过总线相连, 外部设备通过相应的接口电路与总线相连, 从而形成了计算机硬件系统。该结构的优点是信息传送效率较高, 简化了硬件的设计和系统结构, 系统扩充性和更新性能比较好, 同时便于故障诊断和维修。
图1 计算机体系结构中的总线结构
计算机网络是指将分散的计算机设备通过通信线路连接起来, 以实现信息传递的系统。其中, 各计算机的连接有多种方式, 主要有星型结构、环型结构、总线结构等。如图2所示, 计算机网络中的总线结构是一种比较简单, 且在早期比较常用的网络拓扑结构。在总线结构下, 所有设备连接到一条连接介质上, 该连接介质称为总线。所有节点共享一条共用的传输信道, 且任意节点传输的信号都能被其他节点接收。该结构的优点是线缆长度短, 易于布线和维护, 信道利用率高。
图2 计算机网络中的总线结构
数据仓库是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合, 用于支持经营管理过程中的决策制定。数据仓库的构建包括自顶向下结构, 自底向上结构和总线结构3种方式。如图3所示, 数据仓库中的总线结构是指不同的数据源经过数据抽取、转换、排序等直接形成不同主题的数据集市, 这些数据集市通过一种共享维表和事实表的总线结构紧密联系在一起, 形成物理上分散、逻辑上统一的特点。该结构的优点是允许数据集市存在一定冗余和不一致, 数据集市具有自治性, 开发成本较低, 实施周期较短。
图3 数据仓库中的总线结构
3 基于总线结构的政务数据共享
当前研究主要基于统一的大数据中心实现政务数据共享, 但政府部门出于利益和安全性的考虑, 数据共享积极性不高, 因此亟需提出一种新的共享方式。总线结构具有全员互联互通、权限自主管控、物理上分散、逻辑上统一等特点, 为解决上述政务数据共享的问题提供了很好的思路, 因此本文基于总线结构提出了一种新型的政务数据共享模型。
3.1 数据共享模型
如图4所示, 基于总线结构实现政务共享的基本思想是各部门基于统一的标准体系 (包括基础数据标准、元数据标准、资源目录标准和接口标准) 建设或改造数据库, 并通过自主权限管理 (包括用户管理、授权管理和访问控制) 的方式控制访问权限, 从而形成一种逻辑上统一、物理上分散的总线结构。
图4 基于总线结构的政务数据共享示意图
图5直观地体现了总线结构逻辑上统一和物理上分散的特点:逻辑上统一体现在政府各部门首先基于统一的基础数据标准和元数据标准建设或改造数据库, 然后按照统一的标准提交资源目录, 最后通过统一的接口标准进行数据交换共享, 由此可见, 各部门之间不再孤立, 而是通过统一的标准体系联系在一起, 形成逻辑上统一的整体;而物理上分散体现在各部门数据只储存在该部门数据库中, 该部门可以对其用户、授权、数据访问实施自主管理, 因此物理上各部门是分散的。综上, 总线结构的核心内容包括一套标准体系和一套权限管理体系:
图5 政务数据共享平台示意图
3.1.1 标准体系
由于不同政府部门采用的数据库系统、数据格式、数据编码、接口等各不相同, 信息共享十分困难, 因此构建统一的标准体系是实现部门数据共享的前提。
1) 基础数据标准
不同政府部门的数据编码、格式等各不相同, 为实现数据共享, 应对基础数据进行标准化, 具体可采取以下两种方式:
方式一:基于统一的基础数据标准建设或改造部门系统及数据库。政务数据包括结构化数据和非结构化数据, 对于结构化数据, 需统一规定表字段的类型、长度、表示形式等;对于非结构化数据, 需规定数据的格式、编码、分辨率等。
方式二:基于“数据交换中间件”进行标准化转换。数据交换中间件的主要功能是将异构的基础数据转换为标准格式。各部门依据实际需求规定本部门基础数据的存储格式, 在数据共享时通过数据交换中间件 (如基于XML构建) 进行标准化转换, 从而实现数据格式的统一化和标准化。
2) 元数据标准
为方便用户快速了解数据, 需要构建元数据, 元数据是关于数据的数据。在总线结构下, 各部门在技术、资源内容和组织管理上需要达成一致, 因此需要建立元数据标准。元数据标准主要包括内容结构、句法结构和语义结构3方面的标准, 内容结构标准主要包括数据资源的名称、内容概述、创建者、存储地点、介质类型、资源备份等内容的标准;句法结构标准主要包括元数据内容的格式结构及其描述方式的标准;语义结构标准主要包括元数据术语的具体描述方法标准, 包括定义各个元素、修饰词时所采用的标准等。
3) 接口标准
要实现不同部门的互联互通, 需基于统一的访问接口。访问接口相当于一种数据交互协议, 它规定了交互数据格式、数据处理方式等。比如WebService接口利用标准的XML文件描述了数据交互需要的全部细节, 包括消息格式、传输协议和位置等, 此外, 它还基于HTTP协议实现系统间的跨语言调用, 可以很好地应用于数据共享。
4) 资源目录标准
为方便用户的数据访问, 需要提供一个方便检索的导航目录, 该目录就是资源目录。资源目录的主要作用是显示数据资源的整体结构和相互关系, 引导用户快速有效利用信息资源。资源目录主要包括两部分:公共资源目录和交换服务目录。前者主要提供政务部门的数据资源目录信息, 后者主要提供交换服务地址等目录信息。为实现数据共享, 各部门需要按照统一标准 (包括对数据内容、获取路径、数据分类等内容实施结构化描述) 提供本部门的资源目录, 然后由目录管理员按照一定标准进行编目, 形成所有部门的公共资源目录和交换服务目录。
综上, 总线结构标准体系的具体内容如表1所示。一般来说, 标准体系的建立都是在已有的公开标准基础上, 结合对相关业务的调研, 经过专家研讨构建的。因此, 可以基于已有的相关标准, 包括《信息技术数据元的规范与标准化》、《信息分类和编码的基本原则与方法》、《电子政务主题词表编制规则》、《信息技术会计核算软件数据接口》、《政务信息资源目录体系第三部分:核心元数据》等, 构建符合政府部门共享需求的标准体系。
表1 标准体系具体内容
3.1.2 权限管理体系
政府数据涉及大量的政府机密和公众隐私, 因此需要实行严格的权限管理。总线结构下, 各部门对其数据库实行自主管理, 包括访问控制、用户管理和授权管理。
1) 访问控制
用户权限管理的主要目的就是保证系统的安全, 而在信息系统中, 基于用户行为对用户访问进行控制是保证系统安全的主要措施之一。当前主要有3种访问控制策略:自主访问控制 (DAC:Discretionary Access Control) 、强制访问控制 (MAC:Mandatory Access Control) 和基于角色的访问控制 (RBAC:Role-Based Access Control) 。
前两种访问控制方式在授权时需要对每对主体与客体制定访问许可, 当主体和客体的数量非常大时, 授权工作会很困难。而基于角色的访问控制是将单个主体的权限转换为角色的权限, 通过给用户分配不同的角色, 达到赋予用户不同权限的目的。这种方式大大降低了系统的复杂度, 同时体现了系统的组织结构, 简洁并具有灵活性。因此, 本文选取该种方式对用户进行访问控制, 该方式的具体模型图如图6所示。
该模型图中, 角色表示在政府机构中的职责, 如局长、部长等;控制对象是指系统中的数据资源等;操作指程序可执行的动作, 包括对数据表的增删改查等;许可是指对一个或多个控制对象的操作许可;角色权限分配是指为角色分配权限 (一对多关系) ;用户角色分配是指为用户分配角色 (多对多关系) ;会话是指用户激活角色后建立的动态会话集合。
图6 基于角色的访问控制模型图
2) 用户管理
政务共享过程涉及较多用户和角色, 有效的用户管理是权限管理的前提。用户管理是对数据系统中涉及的用户和角色以及它们之间的关系进行管理, 主要包括对用户和角色的新建、修改和删除, 以及对用户和角色之间关系的定义。具体来说, 包含以下内容:
用户和角色的定义。对于用户的属性信息 (包括ID号、姓名、密码等) 需要在系统中进行详细记录;对于角色的信息 (包括角色ID、角色名和相关描述信息) 需要依据其在部门中的职能地位进行定义。
用户角色关系定义。用户与角色存在多对多关系, 一个用户可凭其不同职能拥有不同的角色, 而一个角色也可被赋予拥有相同职能的对应用户。一般通过关联用户ID和角色ID实现对用户与角色关系的定义。
用户角色管理。用户角色管理主要包括用户和角色的新建、修改和删除, 以及用户角色关系的新建和删除。
3) 授权管理
在传统的基于数据中心的政务数据共享过程中, 各部门权责模糊, 数据安全难以保障。而在总线结构方式下, 各部门可以通过自主授权管理明确规定其他部门的访问权限, 很好地避免了权责不清问题。
在基于角色的访问控制方式下, 授权管理的主体对象为角色。通过对角色授权, 并依据用户与角色之间的对应关系, 可以达到对用户授权的目的。本文依据实际管理需求将角色权限分为3种类型:操作权限、对象权限和时间权限。操作权限是规定角色对指定对象的操作许可状态和操作类型;对象权限是指用户可操作的数据对象;时间权限是指用户权限的有效期。因此, 授权管理的主要内容为:首先对系统中的操作对象和操作权限进行定义, 然后设置角色对操作对象的操作权限, 可以用0、1、2来表示其权限状态, 状态值为0, 表示角色对操作对象没有操作权限;状态值为1, 表示角色对操作对象有“只读”权限;状态值为2, 表示角色对操作对象有“可修改”权限。因此, 可以通过对角色、操作对象、可操作权限、有效期间的相应映射, 形成一个四元组。该四元组通过记录角色ID、操作对象ID和操作权限ID和有效时间区间实现对角色的权限配置, 从而实现对用户的授权管理。
3.2 实例分析
某市卫生和计划生育局要为新生儿办出生证明, 需要查询父母的身份信息以及婚姻信息, 其与公安局和民政局基于总线结构的共享过程如下:
首先, 基于统一的标准建设或改造部门数据库。如图7所示, 各部门在建设或改造数据库时需遵循统一的标准体系, 该标准体系是根据实际的业务需求, 参照已有的相关标准, 由各部门协商制定。如基础数据标准中, 规定将图片存储为JPEG格式, 视频存储为MPEG-4格式, 分辨率为512×384等;在接口标准中, 规定各部门统一采用WebService接口;对于资源目录, 各部门按规定的数据内容格式、获取路径格式、数据分类格式等, 提交给目录管理人员汇总编目。在数据共享时, 用户首先访问目录门户, 确定数据资源的存储位置后, 再进行数据共享。
其次, 各部门进行自主权限管理。如图7所示, 首先进行用户管理, 包括对用户、角色以及用户与角色的关系进行定义;其次进行授权管理, 包括对操作对象和操作权限进行定义, 以及构建角色、操作对象、可操作权限、有效时间之间的四元组;最后基于角色进行访问控制。
最后, 各部门通过总线结构进行数据共享。如图7所示, 交互过程主要分为以下几个步骤:
图7 基于总线结构的部门数据共享实例图
①卫生和计划生育局工作人员通过部门系统向总线提交人口信息和婚姻信息访问需求。
②总线向目录服务系统提交人口信息和婚姻信息查询需求。
③目录服务系统首先基于公共资源目录查询是否有人口信息和婚姻信息, 有则基于交换服务目录查询人口信息和婚姻信息的存储位置 (系统) , 否则返回空值。
④将位置信息 (“人口信息在公安局, 婚姻信息在民政局”) 返回给总线。
⑤总线将“人口信息在公安局, 婚姻信息在民政局”返回给卫生和计划生育局。
⑥卫生和计划生育局工作人员向总线提交访问公安局系统的人口信息需求和访问民政局系统的婚姻信息需求, 并提交自己的用户ID。
⑦⑧总线分别向公安局系统和民政局系统提交人口信息和婚姻信息的访问需求。
⑨⑩公安局系统和民政局系统依据工作人员的用户ID分别向部门权限管理系统提交用户权限查询请求, 包括操作权限、对象权限、时间权限。
⑪⑫公安局和民政局权限管理系统分别返回该工作人员在该系统中的权限信息, 如“该用户可在2017年1月1日-2019年12月31日对婚姻信息进行只读操作”, “该用户可在2017年1月1日-2019年12月31日对人口信息进行只读操作”。
⑬⑭公安局系统和民政局系统分别将人口信息及其元数据、婚姻信息及其元数据打包经WebService接口返回给总线。
⑮总线将各系统返回的数据包经WebService接口统一返回给卫生和计划生育局系统。
由上例可以看出, 本文提出的总线结构模型与传统模型相比具有以下几大优势:
1) 数据共享成本大大降低。传统的政务数据共享大都基于统一的云平台或大数据中心实现, 这不仅需要高昂的平台搭建成本, 还需要大量的数据集成、标准化的人力成本和时间成本。而本文提出的数据共享方式只需部门依据统一的标准体系建设或改造部门数据库即可, 不需额外进行数据集成或构建大数据中心, 共享成本大大降低。
2) 数据安全可得到较好保障。传统的基于云平台或大数据中心的共享方式需要对所有部门数据进行权限管理, 庞大的数据量为数据安全保障工作带来极大的挑战。而在总线结构方式下, 各部门可以依据实际业务协作情况对特定部门进行自主权限管理, 大大降低了数据安全保障的压力, 并且可以较好地提高安全性。
3) 部门利益可得到有效保护。传统的数据共享方式需要各部门将数据上传到统一的数据中心, 在数据的整理加工中, 部门数据的边界变得模糊, 那么当出现数据泄露、数据误用等问题时, 可能无法明确追责。此外, 部门间权责不清, 使得在数据资源调用时会出现混乱情况, 这会严重影响系统中数据的安全性, 进而侵害相关部门的利益。而在总线结构方式下, 各部门的数据资源由各部门独立管理, 因此数据安全职责由本部门独立承担。其次, 各部门自主管理用户及其对数据的访问权限, 可以较好地保护部门利益。
4) 无需考虑数据一致性问题。传统的基于云平台或大数据中心的共享方式需要实时维护数据, 保证数据中心与源系统的数据一致性。而在总线结构方式下, 各部门数据只存储在部门系统中, 因此无需考虑一致性问题, 减轻了数据维护工作。
4 结语
由于信息壁垒和安全性问题, 政府部门大量的数据资源无法得到有效利用, 为了更好地促进政府信息化建设, 政务数据共享是一个必然的趋势。然而, 传统的政务数据共享大都基于统一的大数据中心实现, 这种方式主要存在三方面问题:一是共享成本比较高, 包括搭建共享平台的资金成本和集成部门数据并标准化的时间和人力成本;二是数据安全难以保障, 平台中庞大的数据量为数据安全保障工作带来了很大困难;三是部门利益易被侵害, 数据集成导致部门数据的边界模糊, 从而出现权责不清问题, 部门利益难以保护;四是需要考虑数据一致性问题, 定期进行数据维护。
为解决上述问题, 本文提出了一种基于总线结构的政务数据共享应用模型, 该模型的基本思想是:各部门基于统一的标准体系建设或改造部门数据库, 部门按统一的标准存储基础数据和元数据, 并将数据资源按统一标准提交给目录管理员进行编目, 最后通过统一的访问接口实现部门的互联互通;数据共享时, 各部门自主进行权限管理, 包括用户管理、授权管理和访问控制。相较传统的大数据中心共享方式, 该模型通过物理上分散、逻辑上统一的总线结构, 既用较少的成本实现了部门的互联互通, 又通过自主权限管理很好地保障了部门利益和数据安全, 此外还无需考虑数据一致性问题, 大大减轻了数据维护工作, 可行性更强。
本文的研究贡献主要有两方面, 一方面本文为政务数据共享提出了一种崭新的方式, 目前有关政务数据共享模型的研究很多, 但大多数研究基于大数据中心实现共享, 总线结构方式还较少有人提及, 因此本文具有一定的创新性;另一方面本文提出的共享模型具有较强可行性, 它解决了传统方式的很多问题, 包括实施成本高, 数据安全和部门利益难以保障, 数据维护困难等, 有利于推动政务共享的实现。模型的细节及实现将是下一步研究工作的主要方向。