EMPI 算法简介

yola · 发表于 2009-8-27 18:55:25

EMPI 算法种类简介：

EMPI通常被应用在一个集成发送网络中，该网络可含有来源不同分散的系统如注册，时间表，财政以及临床系统等。

EMPI通常被认为的类型有：1）代理商产品，可以和代理商的任何应用结合起来。2）嵌入核心解决方案产品，和代理商的应用绑定销售。

EMPI的部署有主动和被动两种方式：
主动：如前台的注册和时间表进程，使用者确认病人标识，放入注册和时间表系统中。
被动：如病人标识在后台运行，被自动联系，融合到已经存在的数据中。

目前大多数的企业采取的都是先被动式EMPI部署，然后向主动式迁移。

了解EMPI算法种类之前三个重要的学术名次：
重复：对同一个病人在单一事物水平上的MPI 有一个以上的目录或者文档
重叠：对同一个病人在两个以上事物中有一个以上的MPI 目录
覆盖：对一个以上的病人共用一个MPI目录（如两个病人被错误地标识成一个人）

算法：
匹配算法通常被用来解决上面提到的潜在的三个问题。目前常用的匹配算法有：确定法，规则导向法（有时也被称为网络加权法）以及概率法。

确定算法：大多数的传统的医院在使用，也可以被称为精准匹配算法。这一算法是建立在数据元素的集合如姓名，性别，社会保险号上的精准匹配。这一算法被认为在标识潜在重复中有20%-40%的准确率，通常会导致大数量的错误匹配。这一算法在姓名变换，数据缺损，大型数据库中的标识工作中使用受限。

规则导向法：
经常被错误地认为是“Fuzzy 逻辑”或者被当作是概率法。这一算法允许每个组织分配权重，规定有效值，制定特殊的数据元素，并在之后使用这些权重来比较记录。这一算法的要求是提前设置预估加权数，然后将这些权数应用到数据分析中。通常需要多次迭代试差分析直道结果合理化。
一些规则导向算法也使用语音搜索。这一算法得准确率可以在重复识别中高达50%-80%

概率匹配法：
这一算法被认为是目前最优质的算法之一。准确率可高达90%以上。这一算法是建立在复杂的数学公式基础上，这些公式是用来分析专门事物的MPI数据来确定不同数据元素的属性值的精确匹配概率。例如，假设一个MPI文件中姓名“Jones”出现的次数远远多于姓名“Wheatley”。对Jones的匹配（及少可能是同一个人）相对Wheatley的匹配（更高的概率是同一个人）则有较低的意义。

		自动登录	找回密码
密码			欢迎注册