找回密码
 欢迎注册
搜索
热搜: 活动 交友 discuz
查看: 13171|回复: 23

开源项目介绍

[复制链接]
发表于 2007-4-27 11:13:04 | 显示全部楼层 |阅读模式
项目背景:

医疗在知识领域有它的复杂性,学医的都是几十本书一路背过来。如何进行医疗数据的采集和分析,是一个长期以来的问题。数据采集的质量,直接影响到后期的利用,比如数据的集成,分类,统计分析,决策。

目前常见的数据采集方法有两种,自然语言处理和结构化数据录入。自然语言处理,让用户以自然语言的录入,然后用一定的算法获取机器可以分析的数据;结构化录入多则在用户录入之前,预先设定界面和录入数据的约束,实现直接获取机器可以分析的数据。

两者的优缺点,医药信息专业本科生上课应该都学过,谁来回答?呵呵

结构化数据录入多分为模型编辑器和用户录入界面,常见的有microsoft office的Infopath,还有包老师译文中提到的opensde。

把模型编辑器和用户录入界面分开,可以让系统更加灵活,自定义,重用和共享模板。然而,静态的模板缺乏对上下文语义的分析,因而模板在界面出现不符合逻辑的展现。比如, 前文问到病人性别,答复是男性,后文还有月经史的病史询问,又如,病程记录无法模板化。为了弥补这些,静态的模板往往做得非常笼统,求全而失去对细节的深入把握。或者非常的详细,导致很多无关的内容被展现,影响了用户的浏览速度和录入的效率。静态模板也缺乏一个标准的词汇库,来实现录入的数据的标准化。

项目方法学:
在这个开源项目中,我们将和大家互相讨论学习,针对上面两个问题,进行研究,提供一些可行的解决方案。比如,把模板拆才分成很小的结构,然后设置之间的逻辑。借用一种逻辑描述语言 ontology web language,把全部行业知识建模成一个知识库,然后在知识库的上层使用一种工作流引擎。根据用户前期录入的答案,自动运算,根据运算结果,调用并且组合新的录入模板,在逻辑上实现连贯和一致性,实现前台界面的更加灵活的展现。

本次开源项目从起点开始做起,逐渐深入。适合本科生参与。

项目时间:
项目分为四期,技术储备期,项目策划期,开发,评估。

在技术储备,报名人员主要分为两个群体学习:知识建模人员,要求具备医疗知识,主要学习如何建模;计算机编程人员,要求具有基本的编程书水平。

目的:

建立一个以项目为基础的,有进程和进展的学习和讨论空间。主要目的不是最终那个程序,而是这个自我提高的过程:
我们可以讨论,学习新的技术;我们可以结识新的同道;我们可以拓展自我发展的新空间。

开发工具,java,C#.
数据库:MySql

应用前景:

医疗的,可以考虑为电子病历,或者其他科室的智能化数据采集。

药品管理,配伍禁忌的反馈。

非医疗的:
电脑售前咨询系统:
比如,设计computer hardware ontology,比如,945主板支持两个内存条插槽,每个最大1G的内存,只能用到PC4200的速度。然后用户录入一些信息,问,什么电脑配置合适?

系统自动生成 您需要买 945主板,2个1G的内存。

大学信息管理系统:

北大owl ontology导入,我要在去地球物理系找张**教授,查询owl,返回一个XML,call google api,在googel map上面标出北大该学院的位置。

所有大学适用,大家可以建立自己学校的地理owl。

公司内部知识管理系统:

公司业务模型owl.

这几个系统,设计都是类似的,一个数据采集界面,数据存入owl,call 推理引擎(inference engine),实现决策,把决策返回界面,或者call其他的web service,实现其他的功能,比如gmap展现界面。

当然,该领域的知识模型的创建才是关键。
--------------------------------------------------------
感兴趣的同道报名请跟帖:

报名模板:

网名:
联系方式:(倾向于使用MSN)
报名参加组:建模 or 编程
长处:(比如从事过什么方面的工作,研究)
目前状况:
java or C#:分四个组,A. 会用java or C#连接数据库,B.会用java SAX,DOM or c# msXML处理XML C.会用java写 eclipse 插件 D.会用java处理owl
owl 建模:分三个组:A.对某个行业领域专长,比如心内科医生 or 计算机界面高手,B.会用visio做一些模型C.会用owl editor,比如 stanford protege
每周能够参与的时间:
期望在项目中和大家学习分享什么?
对项目的一些建议:

Daniel Chen将为大家建立邮件列表。

[ 本帖最后由 南京猿人 于 2007-5-11 14:29 编辑 ]
 楼主| 发表于 2007-4-27 11:23:43 | 显示全部楼层
网名:南京猿人
联系方式:asazhu@hotmail.com
报名参加组:建模 and 编程
长处:研究过一些电子病历的设计和小型知识库,人机交互,术语库
目前状况:
java or C#:A. java数据库编程,B.java XML编程 D.java owl编程,推荐使用Jena。
owl 建模:A.对公共卫生领域专长,B.会用visio做一些模型C.会用owl editor
每周能够参与的时间:7个小时
期望在项目中和大家学习分享什么?建模的经验,知识模型和程序互动的方法,学习一些架构上的设计
对项目的一些建议:暂无

[ 本帖最后由 南京猿人 于 2007-4-27 11:37 编辑 ]
发表于 2007-4-27 12:01:27 | 显示全部楼层
报名了, 我基本使用C#编程,如果有人想探讨C#的owl编程,可以和我联系。本人同时对hl7模型及编程有点研究,也欢迎交流学习。
发表于 2007-4-27 13:56:46 | 显示全部楼层
网名:laotao
联系方式:petao2004@hotmail.com;taoxindong@gmail.com
报名参加组:建模 and 编程
长处:有系统的医学知识体系,有软件开发经验,自学过人工智能和专家系统方面的知识
目前状况:
C#:A. C#+SQL Server编程 B.通读过W3C XML Schema Part0, 会用.NET DOM模型处理XML数据
owl 建模:A.学过临床医学,会用ASP.NET处理Web界面 B.学过UML和Analysis Pattern, 用过visio C.了解并下载安装了protege
每周能够参与的时间:5小时
期望在项目中和大家学习分享什么?医学知识模型及其应用

对项目的一些建议:
1.首先选择(CDA?)或建立一个全局模型,其次在某一专科领域(例如放射科报告的录入)细化并开发应用系统,最后向其它学科领域扩展。
2. 在建立知识库的过程中不但要考虑项目本身的需要,还要考虑未来用于专业搜索引擎、专家系统和决策支持的可能性

[ 本帖最后由 laotao 于 2007-5-4 12:53 编辑 ]
发表于 2007-4-27 14:25:51 | 显示全部楼层
网名:danelchen
联系方式:danelchen@hotmail.com
报名参加组:建模 or 编程
目前状况:Java & C#
Eclipse plugin develop, Java & C# DB Program, Visio & Rational Rose, UML2.0, DOM
No OWL Skill...
时间不确定。。。
发表于 2007-5-5 11:28:39 | 显示全部楼层

举手~

ivy
Email:ivylxj@vip.sina.com
报名参加组:建模 or 编程
每周能够参与的时间:4-5个小时

UML 比较强~
发表于 2007-5-8 11:27:00 | 显示全部楼层
网名:semtek
联系方式:shpliu73[AT]yahoo.com
报名参加组:建模(OWL)
目前状况:
OWL Guide/Overview 国内主要译者
熟悉Java/OWL 编程
没有医疗领域知识。
时间:不确定

[ 本帖最后由 semtek 于 2007-5-8 11:28 编辑 ]
发表于 2007-5-21 11:08:11 | 显示全部楼层
网名:agg163
联系方式:china_agg@hotmail.com,agg163@163.com
报名参加组:建模 and 编程
目前状况:对医疗行业非常了解,对于软件分析设计编码有深刻的理解,java 和 uml水平也不错。
每周能够参与的时间:5小时
发表于 2007-5-23 21:54:19 | 显示全部楼层
To agg163:
报名参加后请和斑竹联系,认领任务。
发表于 2007-6-1 22:42:31 | 显示全部楼层
掺和一下:
网名:dongxi
联系方式:liguangxi@vip.tom.com
报名参加组:不知哪组
目前状况:中文不错。中西医结合,科研方法论。
时间:每周四到五小时
发表于 2007-6-3 08:34:32 | 显示全部楼层

回复 #1 南京猿人 的帖子

把模型编辑器和用户录入界面分开,可以让系统更加灵活,自定义,重用和共享模板。然而,静态的模板缺乏对上下文语义的分析,因而模板在界面出现不符合逻辑的展现。比如, 前文问到病人性别,答复是男性,后文还有月经史的病史询问,又如,病程记录无法模板化。为了弥补这些,静态的模板往往做得非常笼统,求全而失去对细节的深入把握。或者非常的详细,导致很多无关的内容被展现,影响了用户的浏览速度和录入的效率。静态模板也缺乏一个标准的词汇库,来实现录入的数据的标准化。

项目方法学:
在这个开源项目中,我们将和大家互相讨论学习,针对上面两个问题,进行研究,提供一些可行的解决方案。比如,把模板拆才分成很小的结构,然后设置之间的逻辑。借用一种逻辑描述语言 ontology web language,把全部行业知识建模成一个知识库,然后在知识库的上层使用一种工作流引擎。根据用户前期录入的答案,自动运算,根据运算结果,调用并且组合新的录入模板,在逻辑上实现连贯和一致性,实现前台界面的更加灵活的展现。


这是医学信息学必须跨越的一个槛。但不能把它看成是一个单纯的技术问题。问题的本质是生物医学逻辑不是一般逻辑学(把它当成一般逻辑学是当前十分普遍的一个错误,IT出身的同行较容易犯这种错误)。生物医学知识是高度结构化和异质化的,所以这里涉及到结构(就是模块)的提取的理论问题,结构转化的理论问题,结构整合的理论问题。如果认真读过BMKI的文章的话,就可看出这其实是BMKI的一个思想基石(例如物数学的提出),它的不少探讨是针对这一问题的。

所以建议大家不要从单纯的技术开发的角度来思考问题,而是踏踏实实地思考和理清根本问题。在获得技术成果的同时,把医学信息学从实质上提高一步。
发表于 2007-6-3 11:48:20 | 显示全部楼层
包老师说得对。
生物医学逻辑不能等同于布尔逻辑。
元素或复合元素之间的OR AND 关系不能完整概括生物医学本体中的概念关系。如果加入辅助诊断的导向性功能,则更加需要多层次的逻辑运算,实现过程中效能也有影响。
这方面,可以参考一下 不明原因疾病诊断的计算机方法__.pdf (149.96 KB, 下载次数: 21) 李科威老师观点。
他从哲学及决策学方法探讨了医学诊断形成过程的框架,很有价值。

[ 本帖最后由 dongxi 于 2007-6-3 11:50 编辑 ]
 楼主| 发表于 2007-6-3 15:18:17 | 显示全部楼层
包老师说得很好。描述型逻辑(Description logic)只是逻辑学的一个分支,集合论也只能解决集合问题,而不是概率问题。目前,能够从数据库到前台界面,做到完整实现的,只有Musen倡导的owl DL.其他的逻辑建模语言,还在探讨之中。考虑到大家的知识背景,所以先学习Musen的实现方法,从基础做起。同时关注一些建模的新进展。包老师如果感兴趣的话,不如您也加入进来。我们可以参考您建的模型或者建模语言,做一些实现,也是一种很好的思路。
 楼主| 发表于 2007-6-3 15:23:04 | 显示全部楼层
To Dong xi这个项目中,我们主要考虑的是,如何在大家的有限时间下,实现一个简单的医疗数据采集系统,而不是医疗决策支持系统。这个可能和诊断的目的有些不同。在复杂模型的设计中,由于目前模型工程学还在探讨之中,目前我个人还没有看到大型成功决策系统的案例。
发表于 2007-6-3 22:10:13 | 显示全部楼层

回复 #14 南京猿人 的帖子

目标得到澄清。
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

快速回复 返回顶部 返回列表