找回密码
 欢迎注册
搜索
热搜: 活动 交友 discuz
查看: 2829|回复: 2

[转贴]医学一体化语言系统(UMLS)

[复制链接]
发表于 2007-10-6 11:05:06 | 显示全部楼层 |阅读模式
 楼主| 发表于 2007-10-6 11:06:13 | 显示全部楼层

节选

概念组织:
    叙词表是依据概念(concept)或涵义(meaning)组织起来的,其根本目的是将相同概念的交替名称和不同形式联系在一起,并识别不同概念之间的联系。因此,可以说概念是超级叙词表组织系统的中心。保留原有词表中概念与关系,同时增加了一个新的关联。整合成一个庞大的可控的知识库。
对于同一概念的不同术语以及不同的变异形式,超级叙词表采用三级结构模式,即概念(I 级)-术语(II 级)-词串(III 级),将一个概念的多种不同术语连同多个变异词串有序地组织在一起。对于不同的概念,超级叙词表采用多种“关系”概念如相关概念、组配概念、共现概念等来描述不同概念之间的关系。
 楼主| 发表于 2007-10-6 11:11:30 | 显示全部楼层
表达相同概念的语词串接起来,并在不同概念间建立关系,便于主题相关性的判断 。
在Meta中的每一个概念都会被指定一个概念识别码(unique concept identifier , 简称CUI)。CUI本身不具意义,只用作连结的指针。而每一个表达概念含意的字符串(name or string),不管是大小写的分别或语文上拼字的不同,凡是有差异者均视为一个独立的字符串,而分别赋予不同的字符串识别码(unique string identifier, 简称SUI)。由于Meta实际上是由英文款目所构成的,所以不同词型间表达相同概念的语词要能连结在一起,就必须依赖一般形式识别码术语码(common term identifier, 简称LUI)的指引。

图片1.png

                               
登录/注册后可看大图

未命名.PNG

                               
登录/注册后可看大图


表1:

字符串“Atrial Fibrillation”(心房纤维颤动)和字符串“Atrial Fibrillations” 在系统中被视为不同的字符串,故分别给予不同的SUI编码。然此二字符串实际上仅是单复数形上的差别,所以会被指引到相同的Term identifier (LUIs);同理“Auricular Fibrillation”和“Auricular Fibrillations”也会同样被指引到另一个term identifier (LUIs)。而当系统检视term identifier时会发现“Artial Fibrillation” 和 “Auricular Fibrillation” 在意义上是一致的,所以二个LUIs会被指引到相同的concept identifier (CUIs)。如此循序建立四个不同形式但表达相同概念之语词间的关系。不同语词间关系建立之后,会牵涉到选择用语的问题,如:概念的标准用语、参照互见及缩写形式等。为了节省在选择选用语时所花费的心力,Meta的处理程序是建立索引表间的优先级。以UMLS现有的策略而言, MeSH是Meta所涵盖索引词中,拥有最高优先权的索引系统,所以MeSH中出现的概念词均视为选用词(preferred term),而其它索引表中若有出现表达相同概念而形式不同的语词时,则视为参照款目。同理,若在MeSH中未涵盖的概念,则依第二顺位的索引表来决定选用词的形式,依此类推。

Meta利用LUIs来串接SUIs及CUIs。但是这种处理方式有可能导致一个字符串若含有多种意义时,可能会被错误指引。尤其是Meta中包含多个索引表系统,此类状况当然可能发生。

举例:字符串Cold的含义可能指温度上的冷,也可能是指一般感冒,因此在SUIs中将其分别定义为cold (1)、cold (2),在String部份就会产生四个与cold近似的字。因cold、cold (1)、cold (2)在拼字上仅有些许差异,故被指引到同一个LUI,相对的Common Cold则被指定为另一个LUI。而检视Term identifier时,根据语词含义,再分别指引到所属含义的CUIs,其中Cold因语义模糊,所以被指引到二个Concept identifier,系统以此方式解决同一字符串不同内涵会被错误指引的问题。然而在以后的版本中,有关处理同形异义的问题,可能会采用限定词的方式,如“cold (temperature)”, “cold (disease)”等 。
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

快速回复 返回顶部 返回列表