项目背景:
医疗在知识领域有它的复杂性,学医的都是几十本书一路背过来。如何进行医疗数据的采集和分析,是一个长期以来的问题。数据采集的质量,直接影响到后期的利用,比如数据的集成,分类,统计分析,决策。
目前常见的数据采集方法有两种,自然语言处理和结构化数据录入。自然语言处理,让用户以自然语言的录入,然后用一定的算法获取机器可以分析的数据;结构化录入多则在用户录入之前,预先设定界面和录入数据的约束,实现直接获取机器可以分析的数据。
两者的优缺点,医药信息专业本科生上课应该都学过,谁来回答?呵呵
结构化数据录入多分为模型编辑器和用户录入界面,常见的有microsoft office的Infopath,还有包老师译文中提到的opensde。
把模型编辑器和用户录入界面分开,可以让系统更加灵活,自定义,重用和共享模板。然而,静态的模板缺乏对上下文语义的分析,因而模板在界面出现不符合逻辑的展现。比如, 前文问到病人性别,答复是男性,后文还有月经史的病史询问,又如,病程记录无法模板化。为了弥补这些,静态的模板往往做得非常笼统,求全而失去对细节的深入把握。或者非常的详细,导致很多无关的内容被展现,影响了用户的浏览速度和录入的效率。静态模板也缺乏一个标准的词汇库,来实现录入的数据的标准化。
项目方法学:
在这个开源项目中,我们将和大家互相讨论学习,针对上面两个问题,进行研究,提供一些可行的解决方案。比如,把模板拆才分成很小的结构,然后设置之间的逻辑。借用一种逻辑描述语言 ontology web language,把全部行业知识建模成一个知识库,然后在知识库的上层使用一种工作流引擎。根据用户前期录入的答案,自动运算,根据运算结果,调用并且组合新的录入模板,在逻辑上实现连贯和一致性,实现前台界面的更加灵活的展现。
本次开源项目从起点开始做起,逐渐深入。适合本科生参与。
项目时间:
项目分为四期,技术储备期,项目策划期,开发,评估。
在技术储备,报名人员主要分为两个群体学习:知识建模人员,要求具备医疗知识,主要学习如何建模;计算机编程人员,要求具有基本的编程书水平。
目的:
建立一个以项目为基础的,有进程和进展的学习和讨论空间。主要目的不是最终那个程序,而是这个自我提高的过程:
我们可以讨论,学习新的技术;我们可以结识新的同道;我们可以拓展自我发展的新空间。
开发工具,java,C#.
数据库:MySql
应用前景:
医疗的,可以考虑为电子病历,或者其他科室的智能化数据采集。
药品管理,配伍禁忌的反馈。
非医疗的:
电脑售前咨询系统:
比如,设计computer hardware ontology,比如,945主板支持两个内存条插槽,每个最大1G的内存,只能用到PC4200的速度。然后用户录入一些信息,问,什么电脑配置合适?
系统自动生成 您需要买 945主板,2个1G的内存。
大学信息管理系统:
北大owl ontology导入,我要在去地球物理系找张**教授,查询owl,返回一个XML,call google api,在googel map上面标出北大该学院的位置。
所有大学适用,大家可以建立自己学校的地理owl。
公司内部知识管理系统:
公司业务模型owl.
这几个系统,设计都是类似的,一个数据采集界面,数据存入owl,call 推理引擎(inference engine),实现决策,把决策返回界面,或者call其他的web service,实现其他的功能,比如gmap展现界面。
当然,该领域的知识模型的创建才是关键。
--------------------------------------------------------
感兴趣的同道报名请跟帖:
报名模板:
网名:
联系方式:(倾向于使用MSN)
报名参加组:建模 or 编程
长处:(比如从事过什么方面的工作,研究)
目前状况:
java or C#:分四个组,A. 会用java or C#连接数据库,B.会用java SAX,DOM or c# msXML处理XML C.会用java写 eclipse 插件 D.会用java处理owl
owl 建模:分三个组:A.对某个行业领域专长,比如心内科医生 or 计算机界面高手,B.会用visio做一些模型C.会用owl editor,比如 stanford protege
每周能够参与的时间:
期望在项目中和大家学习分享什么?
对项目的一些建议:
Daniel Chen将为大家建立邮件列表。
[ 本帖最后由 南京猿人 于 2007-5-11 14:29 编辑 ] |