MPP架构主要用于处理大规模的关系型数据库,在数据一致性方面比基于Hadoop技术的分布式存储架构好一些。
但是在医疗行业,关系型数据库和结构化数据存储的比例非常小,以HIS、LIS、EMR等核心系统为例,一个大型三甲医院一年的数据量也不过几十个GB。在医疗行业,数据量最大的非结构化数据,例如PACS系统产生的影像数据,还有在临床医疗服务的过程中产生的病理数据报告等。在处理非结构化数据方面,基于Hadoop技术的分布式存储架构有比较好的优势,用于处理查询实时性要求不高,对数据访问没有低要求的场景比较合适,还可以提供比较好的性价比。
在大数据一体机方面,各个厂商都有自己的解决方案,在技术上相对都比较封闭,价格也比较高,在产品选型上面需要更慎重一些,以免被硬件厂商“绑架”,在后期维护,扩容和将来技术升级上都会受到一些限制。