对于医疗数据的挖掘主要体现在两个方面,首先是用于医院的内部管理,例如深入挖掘用药等。其次,则是用于临床研究。
在大数据时代,对医疗数据和挖掘和利用主要考虑以下几个问题:
1、数据挖掘的目的。例如在对病案资料进行数据挖掘前必须要明确其最终目的是搜集疾病的关联要素还是要有效提高疾病的诊断率。数据挖掘的目的不同,所要构建的模型也是各有不同。
2、数据的存储、清洗和处理
医院在进行数据挖掘前,必须要建立一套数据集中平台,对数据进行集中管理,统一数据标准和格式,对数据进行统一清洗和处理后,才能够进行数据挖掘。医院数据库内积累了大量的数据,所以不论采取哪种数据挖掘方法都不会利用到全部的已有数据,而是从中选择一部分。所以,在数据的选择上必须要有一定的代表性。数据的清洗和处理的意义主要在于它是决定数据挖掘过程是否会成功。
3、最后是数据挖掘的流程。
这一流程包括多个环节,例如数据模型的选择、建模以及实验等。医疗数据挖掘的算法种类也是非常多的比如遗传算法与人工神经网络等等。