国家级测绘地理信息系统数据成果备份设计与建设

行业动态 地图标注国家级测绘地理信息系统数据成果备份设计与建设已关闭评论阅读模式
地图标注

提交资料后最快2小时标注成功


地图标注

摘要

结合国家级测绘地图标注系统数据成果备份的实际需求,基于SAN-Client备份架构和D2D2T备份模式,设计和配置了满足海量数据成果备份与恢复要求的近线备份资源池和离线备份资源池,提出了备份窗口动态策略及备份与恢复流程。基于上述设计,实现了测绘地图标注业务系统和备份系统的松耦合,保障了业务系统运行效率,同时提高了备份系统的可管理性和数据吞吐率。

关键词国家级测绘地图标注系统SAN-Client备份架构D2D2T备份模式近线备份资源池离线备份资源池备份窗口

引言

随着测绘地图标注事业的不断发展,国家级测绘地图标注系统1∶1 000 000、1∶250 000、1∶50 000系列比例尺基础地图标注数据库以及地理国情监测、大地测量等数据库相继建成,截至2019年底,数据成果已达3.8 PB。国家级测绘地图标注系统是国家空间信息基础设施的重要组成部分,是国民经济建设、社会发展和国防安全的基础性和战略性信息资源。

国家级测绘地图标注系统依托局域网,部署于服务器、磁盘阵列和数据库管理软件等构成的互联网技术(Internet Technology,IT)运行环境。IT设备的可靠性和可用性,以及运维人员的操作准确性,直接影响到国家级测绘地图标注系统数据成果的安全性。从运维人员、程序漏洞的误操作或恶意破坏,到IT设备的物理损坏,这些都可能导致数据成果无法挽回的损失,教训往往是惨痛的。2012年,谷歌音乐的程序漏洞致使60万条音频文件被误删除,直接影响了约2.1万用户的正常使用;2020年,IaaS云服务提供商微盟公司运维人员恶意操作酿成的“删库事件”,导致云服务环境及数据遭受严重破坏。由于缺少有效的备份手段,数据长时间未得到彻底恢复,微盟公司和其百万用户都遭受了巨大损失。2007年我国正式出台的《信息安全技术信息系统灾难恢复规范》(GB/T 20988-2007)对数据备份提出了明确要求。目前,国内气象、银行、电信、石油等行业与部门均建立了数据备份系统。

在测绘地图标注行业,采用数据成果备份手段,实现国家级测绘地图标注系统的高可靠性和高安全性,这是非常必要的。2004年,国家级测绘地图标注系统依托国家发改委批准建设的“国家基础测绘设施项目”,配置了StorageTek L700中型磁带库和Veritas NetBackup网络备份软件,搭建了专用的光纤备份网络,成功构建了测绘行业首套LAN-free备份系统。该系统运行十几年来,先后备份了1∶1 000 000、1∶250 000、1∶50 000系列比例尺基础地图标注数据库/更新库,保持了数据成果的安全性。虽然使用单位陆续将磁带库配置的9 840磁带机更新为LTO-4磁带机,但备份速度慢、容量小、影响业务应用系统运行的问题日益突出,全面升级迫在眉睫。

2018年,国家发改委批准建设的“国家测绘数据存储与服务设施项目”为国家级测绘地图标注系统备份系统建设提供了资金和设备支持。通过采用先进的SAN-Client备份架构和D2D2T(Disk to Disk to Tape)备份模式,依托大型自动磁带库、磁盘阵列和网络备份软件,备份系统完成了全面升级工作。

需求分析

国家级测绘地图标注系统配置的LAN-free备份系统备份端主要由备份管理服务器(Master Server)、备份介质服务器(Media Server)和备份客户端(Client)组成。其中备份介质服务器必须架构于业务应用系统之上,既要提供业务服务,同时也要对备份设备进行分配和管理,备份和业务二者采用紧耦合部署方式。这种紧耦合的关系一方面制约了备份系统的灵活性,加大了运维操作的风险;另一方面影响了业务系统的运行稳定性和效率。2007年,国家级测绘地图标注系统采用SunV880 UNIX小型机作为备份介质服务器,同时运行Oracle空间数据库系统,当数据备份操作发起时,数据库系统的运行效率下降了60%~70%。因此,采用SAN-Client模式,构建与业务系统相对独立的备份系统架构,将备份系统与业务系统分离管理,实现业务系统与备份系统的松耦合,为业务系统提供统一、灵活的数据备份服务,这是原备份系统升级的主要方向之一。

国家级测绘地图标注系统配置的LAN-free备份系统采用D2T(Disk to Tape)备份模式,海量测绘地图标注直接由服务器挂接的磁盘阵列通过光纤网络传输到磁带库,由于磁盘读写速度远高于磁带库读写速度,导致备份进程执行效率低下,等待时间长、失败率高。尤其对于大量矢量文件,文件数量大(超过1千万),单个文件小(不大于30 KB),其读写操作对磁带库运行效率产生了巨大压力,数据吞吐率下降到正常数值的30%以下。因此,基于D2D2T备份模式,采用备份一体机作为一级近线存储设备(近线备份资源池),采用大型磁带库作为二级近线存储设备(离线备份资源池),采用客户端加速备份方式,将传统的全备份速度提升到增量备份的速度级。这是原备份系统升级的另一个重要方向。

系统设计
1
系统架构

依托大型磁带库和网络备份软件,采用面向服务的SAN-Client备份架构,突破了传统LAN-free备份架构的制约,实现了备份设备管理和测绘地图标注业务之间的松耦合方式,如图1所示。SAN-Client备份架构将数据备份作为数据保护服务提供给业务应用系统,业务服务器仅安装备份客户端,主要运行数据读取和传输进程,负载小、更稳定,减少了备份设备兼容性问题的出现概率,不会影响整体备份性能和业务运行效率,具有较高的灵活性、可靠性和稳定性。

图1 备份系统架构图

同时,采用备份一体机和大型磁带库分别作为近线备份资源池和离线备份资源池设备,构建D2D2T备份模式。D2D2T备份模式结合了传统磁带离线备份管理和磁盘高速备份的特性,将在线数据快速备份到磁盘设备,确保数据丢失或损坏后能够快速得以恢复。在此基础上,需要长时间保存的低频度访问数据则根据业务需要迁移到磁带库。

D2D2T备份模式较传统的D2T具有更高的吞吐率(Input/Output,I/O),能够依据数据生命周期的特点制定不同的备份管理方式,提高备份资源池的利用效率,减小了备份操作对业务服务器和磁带库造成的工作负荷,释放了宝贵的系统资源。同时,D2D2T备份模式使得备份和恢复窗口大大缩小,策略设置更加灵活,减小了数据成果丢失的风险和业务应用系统停运的时间。

2
备份资源池规划设计

备份资源池主要包括近线备份资源池和离线备份资源池。为了保障国家级测绘地图标注系统数据成果能够快速得到备份保护,采用备份一体机构建近线备份资源池,作为用户备份的首选目标设备。为了长期安全存储数据成果,采用大型磁带库构建离线备份资源池。

备份一体机内置的磁盘备份设备具有良好的读写吞吐能力,可有效支持SAN、LAN等多种网络接入形式的并发备份。近线备份资源池可对磁盘资源进行细粒度规划,可按照数据类型、业务或部门等标准进行备份数据生命周期的细化管理,超过生命周期的数据将被自动迁移到离线备份资源池。数据迁移根据用户访问和离线备份资源池磁带库设备负载情况,确定数据从近线备份资源池迁移到离线备份资源池的具体时间节点。另外,对于海量国家级测绘地图标注系统数据成果备份,配置在备份客户端和离线备份资源池中间的近线备份资源池,能够有效提升用户的备份速度,同时明显减少单位时间内用户与离线备份资源池磁带库设备的交互操作,减少磁带机因频繁使用造成的磨损。

离线备份资源池容量大,扩展性好,适合存储具有长期保存要求的数据成果。离线备份资源池同样可对备份资源进行细粒度规划,按照数据类型、业务要求等标准将数据存储到不同的磁带池内,并设置不同的生命周期。

结合国家级测绘地图标注系统实际,近线和离线备份资源池的容量分别规划为28 TB和8 PB。

3
备份窗口策略设计

数据成果备份策略应结合数据生产的实际情况动态确定备份时间窗口,动态划定间隔周期,主动适应数据生产频率。

在传统备份模式下,由于备份设备性能的制约,多采用固定频率的备份窗口设计,如每周一次增量备份,每月一次全备份,此模式对于实际的数据增量考虑较少,备份效率不高。在配置兼具先进性和规模性的SAN-Client架构的备份系统后,贴近数据增量实际情况,灵活设计国家级测绘地图标注系统备份窗口策略成为可能。备份窗口策略的制定应以恢复点目标(Recovery Point Objective,RPO,指灾难发生后允许丢失的数据量)指标为基础,当数据增量达到RPO时,备份操作就应该立即实施。在数据生产频繁之时,增量达到RPO的周期更短,备份频率应随之增加;反之,应随之减少,为其他项目备份留出备份资源和备份窗口。

国家级测绘地图标注系统数据成果增长是一个动态变化过程,增长率不是一成不变的,存在规律性。对于任一个测绘地图标注生产项目,数据总量能够事先计算出来,设为Dm。在数据生产的早期,数据增长率较快,随着生产接近尾声,增长率放缓,当数据量为Dm时,增长率为0,可表示为

式中,r (d )为数据增长率函数,D为生产的数据量,r和Dm为根据数据生产实际确定的常数。

在t到t+∆t时间段内,数据增量为

于是,d(t)满足如下微分方程

求解微分方程(3),得到

假设d(tn)=Dn,RPO=R,则下一个增量备份时间点tn+1所对应的数据量为Dn+1=Dn+R。基于式(3),得到

采用迭代求解所有增量备份时间节点

对于日常业务较稳定、数据增长规律性较强的测绘地图标注行业,上述模型能够较为准确地确定每一个增量备份的窗口,更贴近业务工作的备份实际需求,在SAN-Client架构下可动态指导日常备份操作。

系统实现
1
设备部署

国家级测绘地图标注系统备份系统由1台主备份服务器(新云东方NA6814)、SAN 客户端(Dell R820)、近线备份资源池设备(NetBackup 5230备份一体机)、离线备份资源池设备(Oracle SL8500磁带库)及备份软件(NetBackup 7.6)组成,如图2所示。

图2 备份系统设备部署示意图

主备份服务器安装备份管理软件,具有备份设备管理、备份策略制定、备份任务的执行等功能,承担备份系统的调度工作。

SAN客户端安装在业务服务器,负责接收主备份服务器的指令,按照不同测绘地图标注业务的备份要求把数据打包,并发送给主备份服务器存放到备份资源池设备。

备份资源池设备作为数据备份介质,主要包括磁盘阵列和磁带库设备。其中,备份一体机的主要性能指标为物理磁盘容量28 TB、4个1 Gb IP接口、4个10 Gb IP接口、8个8 G FC接口,具有重复数据删除功能,前端数据吞吐量可达30.3 TB/h,后端数据吞吐量可达4 TB/h。

大型磁带库的主要性能指标为4个智能机械手、16台LTO6磁带驱动器、10 088个磁带槽位,平均抓取磁带时间<11 s,可提供9.2 TB/hr的吞吐量。磁带库机械手MEBF/MSBF(Mean Exchanges/Swaps Between Failures)为2 000 000 h,磁带库的可用率达到99.96%。

备份软件配置了1个备份服务器许可,2个介质服务器许可,4个客户端许可,16个磁带机许可和16个磁带机共享许可,可实现备份数据的分级管理。借助于备份生命周期策略,根据数据重要性的不同,能够在定义的时间窗口内将数据分别备份到适合的备份介质。

国家级测绘地图标注系统数据成果备份支持基于以太网、光纤网服务端口,以及商业化私有云和开源私有云备份。

2
备份和恢复操作流程

主备份服务器承担备份设备管理、备份策略制定、备份任务的执行和调度工作,管理备份客户端利用LAN或SAN网络,依照备份策略,采用D2D2T备份模式完成备份任务。主要备份和恢复流程如下

1)选择备份资源池

在备份操作开始前,首先选择和备份数据重要度、类型、部门或业务要求一致的备份资源池,确定备份操作和数据存放的目标。访问频度较高的数据成果,可长期存储在近线备份资源池;其他则按照策略自动流转到不同的离线备份资源池。此外,在近线备份资源池删除数据前,确保离线备份资源池已成功备份该数据。

2)定义备份策略

选择备份资源池后,需确定备份策略,主要包括备份窗口(发起时间)、备份数据内容和类型、备份类型(全备份或增量备份等)、副本数目、备份频率和存储生命周期等。

3)备份

在定义好备份资源池和策略后,在指定的时间,备份管理软件自动将业务服务器上的数据成果采用指定的备份方式、通过指定的传输链路写入到指定备份资源池中。为保障业务的连续性,备份管理软件对数据库和应用软件采用在线备份模式,在不停止数据库和应用软件运行的情况下,备份系统保持7×24 h连续运行。

4)恢复

当数据损坏时,技术人员在备份管理软件中选择相应的数据备份项目,从备份资源池依时间顺序进行恢复操作。

备份系统自2016年投入运行以来,累计备份磁带9 393盘,数据总量为16.9 PB,包括1∶50 000数据库更新、地图标注、国情普查监测、专题数据收集、全球测图和历史航摄遥感资料等各类测绘地图标注成果和历史数据,为国家级测绘地图标注系统数据成果安全提供了坚实保障。

结束语

本文提出了基于D2D2T备份模式的设计方案,支撑了国家级测绘地图标注系统数据成果备份系统从传统的LAN-free架构向SAN-Client备份架构的全面升级,实现了业务系统和备份系统的松耦合,在保障业务系统运行效率的同时,提高了备份系统的可管理性和数据吞吐率。下一步的工作将侧重于云环境的备份设计与实施,解决备份系统与云环境的兼容问题,将虚拟化设备和数据卷的备份管理无缝集成到目前配置的SAN-Client架构中,满足测绘地图标注系统云化运行和管理要求。

来源地图标注世界,2020,27(4):57-61.

作者翟永、刘磊、刘津 等

原文始发于微信公众号(地图标注)

如何把自己的门店或公司标注到地图里面。其实很简单:



    1、先准备好门店或公司的门脸照片、名称及地址信息


    2、然后使用微信扫描下面的二维码,按照要求提交资料


    3、提交资料后,客服会联系您进行数据审核,最快2小时内上线