我个人理解,作业背景是,你们学校预先装了一个MMTX的服务器,你需要去MMTX网站看看怎么调用这个服务器.作业要交三个部分:1. 连接服务器, 处理一段医疗文本,或者返回的结果,好像是一个表结构的东东,一边是可能matched 的词,一边是百分比, output可以导入到数据库.2. 截成一堆词汇后,你人工看一下, 算一下sensitivity和precision. http://en.wikipedia.org/wiki/Sensitivity_(tests).多少是对的mapping,多少是错的...出两个数字. 好像发表的一些文章是68%左右, 用了80条chief complaint做的.3. 我的理解是, 换不同的coding set,也就是映射算法一样,然后装载的coding set从UMLS,换成SNOMED,换成 ICD,应该是算mapping到每个coding set的sensitivity and precision,然后和UMLS的performance结果比较一下. 4.最后做一个报表,把原始数据, 数据处理过程,数据结果都写上.或者写一个poster paper.实话说,你们老师应该是工科背景,表达不是很清楚.但是网上类似的文章很多.PUBMED随便找几篇看看人家的方法学. google evaluation of MMTX, UMLS and MMTX, 其实写得很清楚. 做这个作业需要编程背景和医疗背景,一般是group project,一个计算机同学加一个有医疗背景的同学.
[ 本帖最后由 南京猿人 于 2008-2-19 03:45 编辑 ] |