找回密码
 欢迎注册
搜索
热搜: 活动 交友 discuz
查看: 1785|回复: 6

《生物医学知识整合论》一书章节介绍

[复制链接]
发表于 2010-6-10 09:40:31 | 显示全部楼层 |阅读模式
本帖最后由 老包 于 2010-6-10 21:34 编辑

7.3.4
自然语言处理程序开发:谓词标界解析陈述句


CKEFToRDF系列由我的学生高成勉开发,其功能为读入按一行一个陈述句排列的自然文本MKTEFs example.txt文件,阅读和发现谓词,最终以谓词为标界把陈述句解析为可操作性更强的“主体-谓词(或关系)-客体”知识三元体,最后以RDFResource Description Framework)的形式输出到MKTEFs example.rdf

   该程序系列包括如下类:

1.主类CKEFToRDF类调用下列辅类,最终生成输出文件。

2.CreateBPSRLib类:其stringArray()方法建立一个谓词数组,如"causes" "increases" "hardens" "affects""include""is-""is defined as""is greater than""is equal to or less than""is equal to or greater than"…….

3. ReadFileToStringArray类:其fileSplitByLine(fileName)方法阅读一行一个陈述句排列的自然文本MKTEFs example.txt文件,读入到字符串性对象数组strarr,并返回strarr

4ParseCKEF类:调用Search_CKEF_with_BPSR类对每句陈述进行解析。

5Search_CKEF_with_BPSR类利用谓词数组把每个陈述分为头部,谓词和尾部三部分(如该陈述含有定义域,则分为四部分)。

处理对象文件MKTEFs example.txt的片段为:

the hardening of the arteries causes widening of the pulse pressure

Blood pressure of Pre-hypertension is- between 120/80 and 139/89 mmHg

The systolic blood pressure is defined as the maximum of blood pressure in the arteries.

…………

   输出结果文件MKTEFs example.rdf的片段为(与处理对象内容对应):

<rdfescription rdf:about="http://www.bmki.com#the hardening of the arteries">


<bmki:causes rdf:resource="http://www.bmki.com#widening of the pulse pressure"/>


</rdfescription>

<rdfescription rdf:about="http://www.bmki.com#Blood pressure of Pre-hypertension">


<bmki:is- rdf:resource="http://www.bmki.com#between 120/80 and 139/89 mmHg"/>


</rdf:Description>

<rdf:Description rdf:about="http://www.bmki.com#The systolic blood pressure">


<bmki:is-defined-as rdf:resource="http://www.bmki.com#the maximum of blood pressure in the arteries."/>


</rdf:Description>

…………

7.3.5
谓词运算框架语境分析


在上述信息三元体生成以后,接下来的需要探索的工作还很多。本节初步介绍关于所谓谓词运算框架(Computing FrameworkCF)的思考。CF进一步细化陈述句的语境,它的建立和开发无疑有助于机器对陈述句的语义理解,有助于格式化的数据处理和自然文本数据处理。以下对一些陈述句例子作一分析:

谓词实例: The hardening of the arteries causes widening of the pulse pressure.
命题格式: Subject (variable) causes object (variable)
运算框架: If A exists, then B exists。通俗地说,如果A存在,则B存在。

谓词实例: increase of the systolic /diastolic blood pressure increases risk of heart diseasekidney diseasehardening of the arterieseye diseasestroke.
命题格式: Subject (variable) increases object (variable)
运算框架:If A exists, then {(B is divided into BbeforeA and BafterA) and (BbeforeA > BafterA )}。通俗地说,如果A存在,则“A存在以前的B存在”大于“A存在以后的B存在”。
 楼主| 发表于 2010-6-10 21:25:14 | 显示全部楼层
本帖最后由 老包 于 2010-6-13 15:25 编辑

7.3.6 疗法检查程序原型

医疗行为涉及人的健康和生命,应尽量减少可能的失误(例如操作失误等)。这里以药物的日用量检查程序CheckMedication.java为例说明程序运行原理。该程序由笔者与高成勉合作完成。程序系列组成如下:
1.        主类为CheckMedication.java,包含方法三个方法由主方法main调用:
(1)        ReadDrugGuide(File inputXml,String filterCondition)方法阅读药物知识库DrgGuide2.xml中关于药物日剂量的相关知识,返回类数组drugGuide;
(2)        ReadVisitInfo(File inputXml,String filterCondition)方法阅读模拟电子病历MedRecordOb3.xml关于病人就诊的数据(例如就诊日期,诊断,疗法如用药名称,每日用药次数,每次剂量和药物单位等),返回类数组visitInfo;
(3)        CheckDoseOfDrug(DrugGuideInfo[] drugInfo,VisitInfo[] visitInfo)方法被传入drugGuide和visitInfo,输出每次就诊的时间,计算每次就诊的治疗方法中每个药物的每日剂量是否过大或过小,并输出检查结果。
2.        辅类DrugGuideInfo.java为药物知识库建立一个类,以创建相应的数组型对象。
3.        辅类VisitInfo.java为模拟电子病历的每次就诊建立一个类,以创建相应的数组型对象。
4. 辅类Medication.java为模拟电子病历的每次就诊的关于治疗方法的医嘱建立一个类,以创建相应的数组型对象。

程序的输出结果例样为:
The 1th visit is at the time of 2010-02-25 with the following medications informations:
Valsartan's daily dose 40.0 mg is too small!
Amlodipine's daily dose 50.0 mg is too large!
Metoprolol's daily dose 50.0 mg is OK!

The 2th visit is at the time of 2010-05-20 with the following medications informations:
Valsartan's daily dose 180.0 mg is too large!
Amlodipine's daily dose 2.5 mg is OK!
Metoprolol's daily dose 200.0 mg is OK!
 楼主| 发表于 2010-6-12 11:09:08 | 显示全部楼层
本帖最后由 老包 于 2010-6-12 11:11 编辑

BMKI关于<医学信息学>的论述

7.1.1什么是模式

…………..
“但BMKI期望探索和开发的生物医学新模式与传统的朴素的医学模式又有所不同。新模式应该是信息学意义下的模式,富有更多的定量,动态和非常感的语义,描述更为细腻的内容,显示更为微妙的关系,覆盖更多的传统对象难以详尽的对象。医学信息学帮助和促进传统的医学模式向更为个性化的物理世界回归。
例如传统的医学模式往往为文字描述或定义的对象,而信息学意义下的模式则可以是数字,图形,图象或声音描述或记载的,即难以用文字描述或定义的对象。新的模式更多地用现代信息技术识别,分析和处理,而人类的智能则往往对此无能为力。
BMKI相信这几乎是一个广袤无边的新领域。这个领域含有大量的传统医学知识处理方式无法科学地和有效地运算的对象,唯一能对之开发利用的是新的科学--医学信息学。”
 楼主| 发表于 2010-6-25 12:35:26 | 显示全部楼层
本帖最后由 老包 于 2010-6-25 12:37 编辑

7.3.7        异常症状模式的显示和操作
  7.3.7.1 疾病的独立异常症状模式的生成
  7.3.7.2 独立异常症状模式的线性差


因为贴子无法显示公式,请见附件:

异常症状模式的显示和操作.doc

49.5 KB, 下载次数: 7

发表于 2010-6-26 17:48:00 | 显示全部楼层
包老,这本书大约什么时候可以出版了。
 楼主| 发表于 2010-6-29 21:39:09 | 显示全部楼层
谢谢yangzheng关心,已基本完稿!
发表于 2010-6-30 16:51:26 | 显示全部楼层
恭喜包老。
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

快速回复 返回顶部 返回列表