EMPI 算法种类简介:
EMPI通常被应用在一个集成发送网络中,该网络可含有来源不同分散的系统如注册,时间表,财政以及临床系统等。
EMPI通常被认为的类型有:1)代理商产品,可以和代理商的任何应用结合起来。2)嵌入核心解决方案产品,和代理商的应用绑定销售。
EMPI的部署有主动和被动两种方式:
主动:如前台的注册和时间表进程,使用者确认病人标识,放入注册和时间表系统中。
被动:如病人标识在后台运行,被自动联系,融合到已经存在的数据中。
目前大多数的企业采取的都是先被动式EMPI部署,然后向主动式迁移。
了解EMPI算法种类之前三个重要的学术名次:
重复:对同一个病人在单一事物水平上的MPI 有一个以上的目录或者文档
重叠:对同一个病人在两个以上事物中有一个以上的MPI 目录
覆盖:对一个以上的病人共用一个MPI目录(如两个病人被错误地标识成一个人)
算法:
匹配算法通常被用来解决上面提到的潜在的三个问题。目前常用的匹配算法有:确定法,规则导向法(有时也被称为网络加权法)以及概率法。
确定算法:大多数的传统的医院在使用,也可以被称为精准匹配算法。这一算法是建立在数据元素的集合如姓名,性别,社会保险号上的精准匹配。这一算法被认为在标识潜在重复中有20%-40%的准确率,通常会导致大数量的错误匹配。这一算法在姓名变换,数据缺损,大型数据库中的标识工作中使用受限。
规则导向法:
经常被错误地认为是“Fuzzy 逻辑”或者被当作是概率法。这一算法允许每个组织分配权重,规定有效值,制定特殊的数据元素,并在之后使用这些权重来比较记录。这一算法的要求是提前设置预估加权数,然后将这些权数应用到数据分析中。通常需要多次迭代试差分析直道结果合理化。
一些规则导向算法也使用语音搜索。这一算法得准确率可以在重复识别中高达50%-80%
概率匹配法:
这一算法被认为是目前最优质的算法之一。准确率可高达90%以上。这一算法是建立在复杂的数学公式基础上,这些公式是用来分析专门事物的MPI数据来确定不同数据元素的属性值的精确匹配概率。例如,假设一个MPI文件中姓名“Jones”出现的次数远远多于姓名“Wheatley”。对Jones的匹配(及少可能是同一个人)相对Wheatley的匹配(更高的概率是同一个人)则有较低的意义。 |