医院的PACS系统基本上是非结构化数据,数据量每年的增长幅度在20T左右,现在的架构是传统的VMware 虚拟化+SAN集中式存储架构,根据医院后续的发展,存储扩展需求很大。
后续是否可以考虑迁移到VMware 虚拟化+分布式存储架构上,以便有更好的存储可扩展性,不知分布式存储可否满足PACS系统的高I/O性能需求。
如果医院PACS系统全面上云的话,对云端存储有什么要求?
PACS 系统角色服务器和 PACS 影像数据,是两种不同的数据类型。
虚拟化存储和 PACS 影像数据存储,可以统一使用基于万兆以太网的 NFS 高性能 NAS 协议,来同时满足高性能和简化运维的需求。
此外,医院核心业务系统都需要同时满足医院业务连续性和法律合规要求,以规避法律风险,并降低因医院核心业务系统故障,可能带来收入损失。
因此,PACS 系统在建设的时候,还需要全面考虑系统和数据的备份、容灾问题。
根据卫健委 2018 年 4 月发布的《全国医院信息化建设标准与规范(试行版)》中的要求,三甲医院本地数据备份需要具有存储磁盘阵列、存储备份软件两种组件,数据快照、同步异步复制两种技术,以及 10 分钟的 RPO 和 15 分钟的 RTO。应用容灾的 RPO 和 RTO 要求也是 10 分钟和 15 分钟。
由于 PACS 影像数据以 500KB 以下的小文件为主, 并非分布式存储擅长的大文件高吞吐量的业务场景。
此外,由于 PACS 影像数据需要提供长达数十年甚至 100 年的数据保存时间,累积下来的文件数量、整体存储系统的可靠性、存储系统硬件升级换代的风险与成本,还有医疗科研的需求,都是需要妥善考虑的。
PACS 作为现代医院核心业务系统,其存储系统选型,已经从性能、容量的简单存储需求,过渡到全生命周期统一数据管理的综合性业务需求。
收起现在PACS影像信息基本上是切片方式存放数据到存储,随着影像设备的更新和断层扫描能力的加强,只会使得文件数量和占用空间的增速越来越快;所以在选择存储的时候,扩展能力显得尤为重要,但是对于分布式存储的选择不能只衡量带宽吞吐能力,还需要关注其小文件并发处理能力和文件系统总体元数据处理能力,一方面是效率和体现性能,另一方面要看文件系统可存放文件总数量大小;基于PACS的使用特性,可以选择有数据分层能力的分布式存储,打个比方,将可预期的1-3个月数据归类为热数据,存放在高性能数据池,3个月-3年的数据归类为温数据池,存放在一般性能数据池,超过3年的数据放入冷数据池;现在已经有分布式存储+蓝光的解决方案,蓝光数据虽然是冷存,但是也可以快速响应;
个人觉得但凡涉及到数据量比较大的场景,都不要放到公有云,一方面长期存放性价比很低,另一方面数据上去容易下来难啊
每年 20TB 左右的增量算是中小型三甲医院的规模,某些大型三甲医院每天的数据增量接近 1 个 TB 。从医院规模看,迁移到 VMware+VxRail (戴尔超融合)完全能满足 PACS 系统的 IO 性能要求。我们也有日门诊超过 1 万的医院的 PACS 系统采用这样的架构。
全面上云要看上的是医院的私有云,还是第三方公有云。云也要考虑性能、扩展性和数据保护能否满足医院业务发展和各种评审要求。
收起