作者:冯杭建
1 引 言
国土资源数据库涉及图形数据、表格数据以及文档资料等,需要建库的数据量非常大,这就决定了对国土资源数据检查工作的技术复杂度高、难度大、工作量大,因此现有的数据检查方式已无法满足国土资源数据库的检测工作、在国土资源信息交换系统和国土资源数据中心的建设过程中,亦需要通过数据检查和转换软件对汇交的数据进行质量控制和信息交换。因此,如果没有相应的高效检查手段和计算机辅助检查工具,数据检查势必成为国土资源信息交换体系和数据库建设工作中的瓶颈。
为了配合实施土地利用动态监测制度,建立高质量、高标准的国土资源数据中心,为保障国土资源基础数据库建设的质量和信息共享提供有效的技术支持手段,解决国土资源空间数据由于数据的异构带来的数据共享问题,浙江省国土资源厅信息中心从检查验收工作入手,应用 GIS 、空间数据库等技术手段,依据相关标准规范,自主研发了“国土资源数据预检转换系统( LR _ Checker ) ”。 LR _ Checker 可自动检查从图形到属性的全部内容,对数据库成果进行质量控制,保证数据成果的正确性与一致性,提高检查验收巨作效率,缩短工程周期。在确保检查结果无误后, LR _ Checker 可将多源异构空间数据进行无缝入库和数据交换操作,以实现数据的共享。
2 系统设计
2.1 空间数据质检模型
在本研究中,结合 GIS 技术、数据库技术和空间认知理论,分析现有空间数据检测系统利弊,设计了面向规则的智能空间数据质检模型( RSTT)。 RSTT 基于“质检任务、质检方案、质检模板和质检规则”四要素,从几何、语义、空间关系、属性和时态等多方面描述空间数据质量和检测逻辑,体现了新一代空间数据质检模型的设计思想和实现策略。
2.1.1 质检规则
质检规则是 RSTT模型的核心。质检规则总体上可分为两大类:属性质检规则和拓扑质检规则(见图1)。属性质检规则包括:属性值值域检验规则(检查属性值是否在规定的值域范围内)、属性值逻辑组合正确性检验(检查属性组合是否有逻辑错误,是否按有关技术规定正确描述了目标的质量、数量及其信息)。拓扑质检规则包括面面、面线面点、线线线点等规则类型,具体规则有“面层内要素重叠检查”、“线层内要素相交检查”、“线层内要素悬挂节点检查”等。
RSTT模型根据拓扑关系涉及的要素类个数,将拓扑关系分为:要素类内拓扑关系和要素类间拓扑关系,两者的区别是: ( l )要素类内拓扑关系:只涉及一个要素类,即源要素类,它用于维护同要素类内同一或不同类型要素间的拓扑关系;( 2 )要素类间拓扑关系:涉及两个要素类,即源要素类和目标要素类,它用于维护不同要素类内不同类型要素间的拓扑关系,即维护一个要素类内的某类要素与另一个要素类内的某类要素间的拓扑关系。
要素类内的拓扑关系描述较为简单,主流的 GIS 软件平台(如 MaPGIS 、 SuperMap等)一般都可支持对其进行有效性验证。而要素类间拓扑关系则比较复杂,目前绝大多数的 GIS 软件平台都还未对其有效性验证提供支持,因此成为本研究所需要重点解决的问题。 LR _ Checker 提供 25个拓扑质检规则,用于检测“点要素必须位于线上”等 25 类原子级的拓扑关系,所以要素类间拓扑关系的检测是 LR _ Checker系统的一大特色。如土地利用现状数据库规范中,要求地类图斑层的边界应与地类界层中的地类界图形一致,如地类图斑边界在地类界层中无对应地类界存在,则该地类图斑视为错误如图 1 所示,地类图斑层中 B 图斑由于在地类界中无对应的地类界,则相应边界视为错误同类型的规则还有“面层内要素被另一个曲层要素覆盖”、“点必须被线覆盖”等。
2.1.2 规则库
LR_Checker 根据空间数据质量评价因子,建立了用于数据质量检测的规则库。按照检测数据类型的不同,规则库内规则又可分为基础规则和扩展规则两大类(见图 2 ) ,其区别是: l )基础规则:适用于所有空间数据质量检测,具有普遍性,如“面层内要素不相互重叠”等; 2 )扩展规则:针对某类数据类型,无法使用基础规则进行检查,而专门定制的规则,如针对土地利用现状数据的检测而专门定制的“地类面积统计对比规则”等。由于 LR_Checker 给质检规则的开发提供了标准的虚函数接口,因此第三方软件厂商可以基于这些标准虚接口开发出质检规则,从而扩展规则库。对于规则库中已经开发完成的规则,可通过灵活定制功能,按照需求实例化相应的规则,然后添加进质检方案,从而满足对特定数据特定需求的检测。
LR_Checker规则库包括 36 个基础规则,其中属性规则 11 个(见表 l ) ,拓扑规则 25 个(见表 2 , 只列出 9 个面拓扑规则)。
2.2 系统体系结构
LR_Checker 基于 RSTT模型,设计为四层体系结构(见图 3 ) ,包括:数据交换层、预检功能层、预检应用层和逻辑层通过使用四层体系结构的方式,系统的层次结构分明,模块间的相互依赖性最小,提高了系统的稳定性、健壮性。
( 1 )数据(交换)层:数据(交换)层是预检系统的灵魂所在,各自类型的空间数据库统一构成系统数据层,负责进行一切信息数据的存储、交换、管理。采用多源空间数据无缝集成技术( SIMS ),整合多源空间数据。支持的数据格式有: EOO 、 VCT 、 Coverage 、 ArcGIS Personal Geodatahase、 Shapefile 、 CAD ( DWG 和 DXF )、 MapInfo ( MIF 和 TAB )、 MapGIS (WT、 WL、MP) ,基本涵盖了现有国土资源数据格式;
( 2 )预检功能层:预检功能层在整个系统体系结构里处于核心地位,所有的预检功能,包括数据的有效性与规范性检查、图形检查、属性检查等,均在该层实现,是系统构建的基础;
( 3 )预检应用层:预检应用层是系统的界面和功能的体现,面向系统的最终用户,因此系统的界面设计尽量简捷,以使质量检查人员容易上手,将注意力集中于质量检查功能本身;
( 4 )逻辑层:逻辑层负责维护数据交换层、预检功能层和预检应用层之间的联系,维护系统运行逻辑。
2.3 功能模块
LR_Checker 包括五大功能子系统(见图 4 ),各模块主要功能简要介绍如下。
( l )空间数据交换模块(简称“ LR_ DataExchange”):用于数据交换,管理前端入库的待检数据,并在确保数据检测无误后,将数据输出到最终结果库;
( 2 )标准管理模块( LR _ DicMgr ):用于各类建库标准字典的维护;
( 3 )模型建模模块( LR _ ModelBuilder ):用于维护质检模型,对数据实行批量全自动检测;
( 4 )错误查看子模块( LR _ ViewResult ):用于对检测结果进行浏览查询;
( 5 )结果评价及输出模块( LR _ StatEva ):用于对数据检测结果的统计评价以及输出。
2.4 质检流程
LR _ Checker 数据质检及转换流程如图 5 所示,具体如下所述:
( 1 )待检数据:待检查的数据是各种类型各种格式的成果数据,主要包括土地利用现状数据、土地利用规划数据和地籍数据;
( 2 )数据交换:读取各种格式的待检数据,逐层或批量导入空间数据“母库”;
( 3 )任务建立:定制数据质检方案,并针对入库的待检数据选用定制的方案,建立数据检查任务;
( 4 )自动检查:根据创建的任务与选择的数据质检方案,从空间数据“母库”中读取空间数据进行自动检查,并将检查的结果写回到空间数据子库和属性结果库中;
( 5 )手工检查:不能用计算机自动检查的内容,用手工检查;
( 6 )结果查看:通过人机交互的方式进行检查结果的查看;
( 7 )检查结果统计评价及报告输出:对检查结果进行质量评定,并输出质检报告;
( 8 )数据修改:如果经质量评定数据不合格,则返回到原数据生产系统或第三方系统中修改数据;
( 9 )数据交换:如果经质量评定数据合格,则通过空间数据交换子系统,将检查合格的数据批量导入到“ ArcSDE 海量空间数据库”。
3 系统实现及应用
3.1系统实现
考虑到系统效率、软件成本等原因, LR _ Checker 采用“ VC6.0 + ArcGIS Engine 9. l + Personal Geodatabase ”的模式进行开发。基于 RSTT 空间数据质检模型,根据四层体系结构的系统框架,在数据层上,以基础地理信息、和土地利用、规划数据、地籍数据为基础,提供数据访问接口,建立空间数据交换子系统(见图 6 ) ;在预检功能层上,根据主要的预检应用需求等内容,建立预检模型建模子系统(见图 7 ) ;在预检应用层,采用交互式的方式,提供检测结果查看子系统(见图 8 )和统计评价及结果输出子系统(见图 9 ) ,实现检查结果的交互查询、分析评价以及报告的打印输出等功能;在逻辑层上,提供标准管理子系统(见图 10 ) 管理数据库建库标准,并提供 API 函数维护其它几层的联系。
3.2 系统应用实例
LR _ Checker针对土地利用规划数据数据、土地利用现状数据和地籍数据定制的质检方案,已经在浙江省国土资源厅得到应用。
( l )地籍数据质检方案
根据浙江省国土资源厅的《浙江省城镇地籍数据库建设技术规定(试行)》,定制适用于浙江省县城镇地籍数据检查验收的数据质检方案。就拓扑关系检查而言,根据地籍要素拓扑关系特点,划分为 5 大类和 18 个小类拓扑关系,分别定制规则进行检查。 5 大类包括:面要素类拓扑关系、线要素类拓扑关系、面要素类和面要素类拓扑关系、面要素类和线要素类拓扑关系、点要素类和线要素类拓扑关系; 18 个小类包括地类图斑面内无叠盖无缝隙等拓扑关系。
( 2 )土地利用现状数据质检方案
根据浙江省国土资源厅的《浙江省县(市)级土地利用数据库建设规范(试行)》,定制适用于浙江省土地利用现状数据检查验收的数据质检方案。就拓扑关系检查而言,根据土地利用现状要素拓扑关系特点,划分为 5 大类和 17 个小类拓扑关系,分别定制规则进行检查。 5 大类包括:面要素类拓扑关系、线要素类拓扑关系、面要素类和面要素类拓扑关系、面要素类和线要素类拓扑关系、点要素类和线要素类拓扑关系, 17 个小类包括地类图斑面内无叠盖无缝隙等拓扑关系。
( 3 )土地利用规划数据质检方案
根据浙江省国土资源厅的《浙江省县(市)级土地利用规划数据库标准(试行)》,定制适用于浙江省土地利用规划数据检查验收的数据质检方案。
地籍数据检查验收方案对宁波市鄞州区土地勘测规划院提供的姜山等地的大量地籍数据的检查中得到应用。土地利用现状数据检查验收方案和土地利用规划数据检查验收方案,在浙江省国土资源厅的建设用地审批管理信息系统的图形数据建库成果的检查验收过程中得到应用,对杭州、建德、富阳、湖州、长兴等地的土地利用现状和规划数据进行了检查验收,从而有效保证了成果数据的质量。
4 结 语
实际应用和系统测试表明, LR _ Checker 运行稳定,性能高效,功能全面,具有以下特色:
① 数据交换和数据质检一体化,为国土资源信息交换系统建设提供数据质量保障;
② 支持交换的数据格式基本涵盖现有国土资源数据库成果格式,数据交换批量自动进行;
③ 基于规则的质检方案可灵活定制,提供能够对不同要素类进行拓扑关系检测的质检规则,数据检测批量自动进行。然而, LR _ Checker 在对数据质量的评价功能方面相对比较薄弱,评价模型不够系统和全面,有待课题组日后进行进一步完善和改进。
参考文献
1、龚健雅,徐枫,吴华意. 国土资源信息交换系统的多级异构体系与关键技术[J]国土资源信息化, 2005(4),24-31
2、郭达志、范爱民. 基于信息论的 GIS 空间数据质量评价[J] 中国矿业大学学报:自然科学版, 2001,30(3):221-224
3、吴芳华,张跃鹏,金澄. GIS 空间数据质量的评价[J] 测绘学院学报, 2001, 18(1): 63-64
4、冯杭建 .面向网络的海量空间数据库引擎研究与开发[D] 杭州:浙江大学 2004
5、宋关福,钟耳顺,刘纪远等. 多源空间数据无缝集成研究[J].地理科学进展, 2000, 19( 2 ): 110-115
6、Geodatabase Object Model . America : ESRI Press , 2005 :1-1
7、ESRI What Is ArcGIS ? [ EB / OL ] http://www.esri.com/software /arcgis/about/overview.html,2006-3-8
8、浙江省国土资源厅. 浙江省城镇地籍数据库建设技术规定(试行)[S] 2005
9、浙江省国土资源厅. 浙江省县(市)级土地利用数据库建设规范(试行)[S]2004
10、浙江省国土资源厅. 浙江省县(市)级土地利用规划数据库标准(试行)[S] 2005