首先可以采用虚拟化或者超融合的架构来构建整体的业务,对于数据库类型的数据,通过备份一体机+CDP做近线备份。海量的非结构化影响系统用独立的分布式存储,多副本方式来提高安全性,如果资金允许,可以在增加磁带库对近线的数据库备份和非结构化数据做归档备份。
收起医疗行业的数据备份有下面几种情况,本质上就是分级存放的问题:
1. 一类就是通用的备份需求,比如his数据库,这些按常规去规划就可以,按照自己的实际恢复需求和恢复时效去设计。
2. 还有就是一些生命周期比较明显的,比如病例相关的影像检查等。可以根据数据的冷热特性做分级存储。分级可以通过多种方式实现,比如有的存储本身可以实现,有的通过软件实现,比如gpfs、tsm的hsm等。
3. 接上条,这些类型的数据有些实际上已经做了初步设计,比如很多医院会将这些数据大批量的集中存放到nas上,或者还有些尝试放到自己的分布式存储、对象存储上。对这些设备的二次保护,也可以接入备份系统,目前比较常见的是通过ndmp的方式挂接带库,数据备份到带库里。这种情况下,带库只做最终的数据备份,冷热的分级存储在nas层做过了,后续备份设计的时候可以基于nas上规划的卷来做进一步规划。
4. 最后一类就是,基本不再访问或很少访问的,以法规遵从为主的数据归档。这种的基本上就可以直接下到磁带中保存好就行。 也有的医院自己的私有云存储已经做的比较成熟了,这部分数据落到私有云里也行。
以上说的这几种情况,可能会通过多种产品或技术实现,也有归纳到一种备份方案里的,早些年曾给某院做的tsm的方案,现在看有点过时,原理上差不多,供参考:
1. 生产常用的各种数据库,重要文件使用tsm备份。一部分直接进3584磁带库,一部分经常恢复的先进n6000的nas,一个月后迁入带库
2. n6000本身存放了大量的业务数据,自身做了分级存储(这块不确定,不是我们做的),通过ndmp挂到3584的逻辑分区带库,备份到带库。
3. 额外有几个特殊系统,使用hsm,根据策略存放文件,不常用的会自动迁移到带库,本地目标保留类似快捷方式的文件指针,双击回调。
4. 还有一部分系统的数据做长期归档,直接入磁带库,最后定期出库保存。