找回密码
 欢迎注册
搜索
热搜: 活动 交友 discuz
查看: 3584|回复: 0

EMPI 算法简介

[复制链接]
发表于 2009-8-27 18:55:25 | 显示全部楼层 |阅读模式
EMPI 算法种类简介:

EMPI通常被应用在一个集成发送网络中,该网络可含有来源不同分散的系统如注册,时间表,财政以及临床系统等。

EMPI通常被认为的类型有:1)代理商产品,可以和代理商的任何应用结合起来。2)嵌入核心解决方案产品,和代理商的应用绑定销售。

EMPI的部署有主动和被动两种方式:
主动:如前台的注册和时间表进程,使用者确认病人标识,放入注册和时间表系统中。
被动:如病人标识在后台运行,被自动联系,融合到已经存在的数据中。

目前大多数的企业采取的都是先被动式EMPI部署,然后向主动式迁移。

了解EMPI算法种类之前三个重要的学术名次:
重复:对同一个病人在单一事物水平上的MPI 有一个以上的目录或者文档
重叠:对同一个病人在两个以上事物中有一个以上的MPI 目录
覆盖:对一个以上的病人共用一个MPI目录(如两个病人被错误地标识成一个人)

算法:
匹配算法通常被用来解决上面提到的潜在的三个问题。目前常用的匹配算法有:确定法,规则导向法(有时也被称为网络加权法)以及概率法。

确定算法:大多数的传统的医院在使用,也可以被称为精准匹配算法。这一算法是建立在数据元素的集合如姓名,性别,社会保险号上的精准匹配。这一算法被认为在标识潜在重复中有20%-40%的准确率,通常会导致大数量的错误匹配。这一算法在姓名变换,数据缺损,大型数据库中的标识工作中使用受限。

规则导向法:
经常被错误地认为是“Fuzzy 逻辑”或者被当作是概率法。这一算法允许每个组织分配权重,规定有效值,制定特殊的数据元素,并在之后使用这些权重来比较记录。这一算法的要求是提前设置预估加权数,然后将这些权数应用到数据分析中。通常需要多次迭代试差分析直道结果合理化。
一些规则导向算法也使用语音搜索。这一算法得准确率可以在重复识别中高达50%-80%

概率匹配法:
这一算法被认为是目前最优质的算法之一。准确率可高达90%以上。这一算法是建立在复杂的数学公式基础上,这些公式是用来分析专门事物的MPI数据来确定不同数据元素的属性值的精确匹配概率。例如,假设一个MPI文件中姓名“Jones”出现的次数远远多于姓名“Wheatley”。对Jones的匹配(及少可能是同一个人)相对Wheatley的匹配(更高的概率是同一个人)则有较低的意义。
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

快速回复 返回顶部 返回列表