找回密码
 欢迎注册
搜索
热搜: 活动 交友 discuz
查看: 3576|回复: 5

求助--即将被UMLS之类的东西折磨疯了!

[复制链接]
发表于 2008-2-18 08:25:16 | 显示全部楼层 |阅读模式
各位德高望重的老师们,
大家好。想请教个问题,其实也不太好意思问,因为可能太原始了,不过我实在是要被折磨疯了!谁有时间能略微指点一二?其实我已经向一位老师请教,不过因为他很忙,不知道他是否有时间回复我,而我只有两天时间做这个作业,所以恳请大家帮忙!!!谢了!!!
说实话,我甚至不能保证问题是不是问的明白清楚。所以请看要求:
use MMTx to process the text of one case. The output from MMTx is then processed to determine the sensitivity of different source vocabularies (ICD-9-CM, SNOMED CT) for matching words used in the case to terms available in UMLS. Then compare the mapping via UMLS versus a subset of UMLS (SNOMED CT) using programs that process MMTx output.
Deliverables: A report discussing the findings and the Excel Files generated by running the output of MMTx through sensitivity and precision programs.
差不多就是这个要求,我不懂怎么用EXCEL来做呢?
拜托大家.谢了!!!
发表于 2008-2-18 17:37:16 | 显示全部楼层
首先,这个是作业吧?我理解大概的意思是
从一份病历中选文字,然后用MMTx来处理,比较一下使用不同的词表处理同一份病历时候这些词表的敏感度。
我们以前使用的MMTx输出的都是文本(.txt)文件,各个字段之间有固定的分隔符,所以需要处理一下,就是这里说的using programs that process MMTx output。不知道现在是否有新的功能,很久不用了。
让你交出一份讨论得到的结果的报告,同时还要交一份EXcel文件,因为得到敏感度、精度都需要计算,我的理解是你可以简单地把MMTx输出的文本型的结果复制粘贴到Excel表格中,然后用分列功能简单地把各个字段分开,然后用excel的计算能力,按照检全率和检准率的公式 来计算使用不同词表和使用整个UMLS来处理病历上的能力。
不知道我这样解释是否对路,其实一般国外的学生excel处理数据是基本的能力,所以没有详细解释。

[ 本帖最后由 zilu85 于 2008-2-18 17:39 编辑 ]
发表于 2008-2-19 03:22:34 | 显示全部楼层
我个人理解,作业背景是,你们学校预先装了一个MMTX的服务器,你需要去MMTX网站看看怎么调用这个服务器.作业要交三个部分:1. 连接服务器, 处理一段医疗文本,或者返回的结果,好像是一个表结构的东东,一边是可能matched 的词,一边是百分比, output可以导入到数据库.2. 截成一堆词汇后,你人工看一下, 算一下sensitivity和precision. http://en.wikipedia.org/wiki/Sensitivity_(tests).多少是对的mapping,多少是错的...出两个数字. 好像发表的一些文章是68%左右, 用了80条chief complaint做的.3. 我的理解是, 换不同的coding set,也就是映射算法一样,然后装载的coding set从UMLS,换成SNOMED,换成 ICD,应该是算mapping到每个coding set的sensitivity and precision,然后和UMLS的performance结果比较一下. 4.最后做一个报表,把原始数据, 数据处理过程,数据结果都写上.或者写一个poster paper.实话说,你们老师应该是工科背景,表达不是很清楚.但是网上类似的文章很多.PUBMED随便找几篇看看人家的方法学. google evaluation of MMTX, UMLS and MMTX, 其实写得很清楚. 做这个作业需要编程背景和医疗背景,一般是group project,一个计算机同学加一个有医疗背景的同学.

[ 本帖最后由 南京猿人 于 2008-2-19 03:45 编辑 ]
发表于 2008-2-19 03:39:47 | 显示全部楼层
当然,自己对NLP nature language processing从项目设计到项目评估,自己要有一些基本的认识.这也是平时的基本功. 而且,你的这个作业基本目的只是走个流程,学习方法学. 因为有两个limitation.
1. 样本数据量太小.样本无控制.
2. 没有行业专家对机器的output做evaluation.也就没有了golden standard.
 楼主| 发表于 2008-2-19 05:42:47 | 显示全部楼层
十分感谢崔老师和斑竹的帮助.受益非浅.

这个方向我想我还会遇到很多问题和困难,以后还要请各位老师多多帮助!由衷感谢.:)
发表于 2008-3-12 08:06:53 | 显示全部楼层
恩,像NLP的项目作业
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

快速回复 返回顶部 返回列表