|
楼主 |
发表于 2007-10-6 11:11:30
|
显示全部楼层
表达相同概念的语词串接起来,并在不同概念间建立关系,便于主题相关性的判断 。
在Meta中的每一个概念都会被指定一个概念识别码(unique concept identifier , 简称CUI)。CUI本身不具意义,只用作连结的指针。而每一个表达概念含意的字符串(name or string),不管是大小写的分别或语文上拼字的不同,凡是有差异者均视为一个独立的字符串,而分别赋予不同的字符串识别码(unique string identifier, 简称SUI)。由于Meta实际上是由英文款目所构成的,所以不同词型间表达相同概念的语词要能连结在一起,就必须依赖一般形式识别码术语码(common term identifier, 简称LUI)的指引。
表1:
字符串“Atrial Fibrillation”(心房纤维颤动)和字符串“Atrial Fibrillations” 在系统中被视为不同的字符串,故分别给予不同的SUI编码。然此二字符串实际上仅是单复数形上的差别,所以会被指引到相同的Term identifier (LUIs);同理“Auricular Fibrillation”和“Auricular Fibrillations”也会同样被指引到另一个term identifier (LUIs)。而当系统检视term identifier时会发现“Artial Fibrillation” 和 “Auricular Fibrillation” 在意义上是一致的,所以二个LUIs会被指引到相同的concept identifier (CUIs)。如此循序建立四个不同形式但表达相同概念之语词间的关系。不同语词间关系建立之后,会牵涉到选择用语的问题,如:概念的标准用语、参照互见及缩写形式等。为了节省在选择选用语时所花费的心力,Meta的处理程序是建立索引表间的优先级。以UMLS现有的策略而言, MeSH是Meta所涵盖索引词中,拥有最高优先权的索引系统,所以MeSH中出现的概念词均视为选用词(preferred term),而其它索引表中若有出现表达相同概念而形式不同的语词时,则视为参照款目。同理,若在MeSH中未涵盖的概念,则依第二顺位的索引表来决定选用词的形式,依此类推。
Meta利用LUIs来串接SUIs及CUIs。但是这种处理方式有可能导致一个字符串若含有多种意义时,可能会被错误指引。尤其是Meta中包含多个索引表系统,此类状况当然可能发生。
举例:字符串Cold的含义可能指温度上的冷,也可能是指一般感冒,因此在SUIs中将其分别定义为cold (1)、cold (2),在String部份就会产生四个与cold近似的字。因cold、cold (1)、cold (2)在拼字上仅有些许差异,故被指引到同一个LUI,相对的Common Cold则被指定为另一个LUI。而检视Term identifier时,根据语词含义,再分别指引到所属含义的CUIs,其中Cold因语义模糊,所以被指引到二个Concept identifier,系统以此方式解决同一字符串不同内涵会被错误指引的问题。然而在以后的版本中,有关处理同形异义的问题,可能会采用限定词的方式,如“cold (temperature)”, “cold (disease)”等 。 |
|