找回密码
 欢迎注册
搜索
热搜: 活动 交友 discuz
查看: 5238|回复: 23

最近在想 电子病历的时候 掉进了死胡同

[复制链接]
发表于 2004-11-5 01:07:03 | 显示全部楼层 |阅读模式
因此想向包老师及各位请教一下。虽然看上去是个统计问题,但我隐隐觉得并不完全是统计方面的问题,所以放在这里。

第一个问题:
统计中如何解决分层数据与分类资料混合的问题??
举例来说:


压痛                       
            无               
            有               
反跳痛                       
              无               
              有        程度       
                                            轻
                                            中
                                             重

压痛与反跳痛的无、有属于分类数据,但反跳痛的程度轻、中、重却是分层资料。
有时量表的统计往往将他们混在一起。这样合理吗?如果不合理,应该怎么办才算合理?

第二个问题:
在上例中,除了数据性质的问题,还有数据层次的问题,反跳痛的程度数据与反跳痛的无、有数据显然处于不同的层次,自然也与压痛的无、有处于不同的观察层次,这种层次会影响统计方法的选用吗?
处理这种树状结构的数据,用多元统计方法可行吗?如果多元统计不可行的话,人工智能可行吗?如果这个树状分支继续延伸呢?

第三串问题:
参数,操作,结果诊断的问题
前提1:上述的两个问题
前提2:SNOMED编码的规则是:部位+操作+结果
前提3:人=照相机,视诊=光圈,触诊=焦距,即不同诊查方法被看作不同的“机器”参数。


SNOMED编码合理吗?反跳痛的严重是依靠单一的触诊获取的吗?显然不是的,医师触摸痛点,再通过病人的反应确定反跳痛的程度,即
   部位+操作1+操作2=结果。
这样如何实现SNOMED的规则呢?

如果我想得到一个部位体征的判别式:
     触诊参数*触诊系数+视诊参数*视诊系数=反跳痛的严重度
这似乎是可行的。这类似于
        光圈*光圈系数+焦距*焦距系数=照片质量

但是否要考虑不同的光圈、焦距组合,或者说触诊、视诊组合。
比如用海鸥相机的光圈+CANON相机的焦距显然不等于CANON相机的光圈+CANON相机的焦距


于是就有
     医师A的触诊+医师B的视诊 显然不等于 医师A的触诊+医师A的视诊。
不仅这样,还有,
     医师A的左手触诊+医师A的视诊 也不等于 医师A的右手触诊+医师A的视诊
更有,
   60岁医师A的左手触诊+医师A的视诊 也不等于 61岁医师A的左手触诊+医师A的视诊

如果为了实现完全精确的量化,必须记下多少参数呢?除了患者的各项参数,还有医师的年龄,性别,左右手,如果出现诊法组合的话,还要记录诊法一的医师参数,诊法二的医师参数……那是不是太复杂了呀?
发表于 2004-11-6 10:19:11 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

dongxi提了一个很好的问题,是非常典型的生物医学信息学问题,其中有些部分我们生物医学知识整合论(BMKI)已经,正在或将要加以演绎。层次问题或一些分类问题是结构问题,因此这确实不是一个纯统计问题。

生物医学问题几乎总是“结构加随机”的复合问题,复杂的结构在医学信息学中非常突出,这形成生物医学知识工程问题有别于一般知识工程的特点。在生物医学知识工程中,医学信息学往往采取“拿来主义”,引进诸如逻辑规则,语义网络,框架方法(包括本体),数据挖掘,人工智能,神经网络等等技术,这是非常必要的,但这远远不够。医学信息学必须对生物医学知识本质加以深入探讨。但至今我们还没有很好地探索,因而有学者感叹医学信息学缺乏“哲学层次”的研究。

BMKI一再强调知识世界存在着意识性结构和物理性结构。对此我们今后讨论。结构问题本质上是决定性问题,而不是随机性问题。例如A与B是“父子关系”属关系结构,因此统计“A叫B爸爸”的几率和“B叫A爸爸” 的几率是无意义的。如“A血管和B血管在血管树上为上游血管和下游血管”,统计“A血管向B血管流动”和“B血管向A血管流动”的概率也是没有意义的。

因为结构问题是决定性的,所以往往是个性化的,难以一般化或形成理论。生物医学知识工程的一个突出的问题是“结构爆炸”。但由于计算机的存储和速度能力的不断增强,分布式存储技术和平行处理技术等发展,现代或未来医学信息学并不畏惧这个“爆炸”,这也是我一直呼吁论坛须认真考虑探索并实现一些大的生物医学信息学项目的理由。虽然我们会遇到很多难以想象的困难,但目前国际学术环境和经济-学术的新型关系等都是有利的。

相反,统计学只论现象,只论系统的输出,不考虑这些现象或输出是如何形成的,并且深层的假设是各种现象是彼此独立的,即非结构的。

今天回复到此为止。
 楼主| 发表于 2004-11-6 15:47:56 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

最初由 老包 发表
[B]相反,统计学只论现象,只论系统的输出,不考虑这些现象或输出是如何形成的,并且深层的假设是各种现象是彼此独立的,即非结构的。
[/B]


但我还未能跟 “爆炸”联系起来。
等着下文。
发表于 2004-11-7 20:57:38 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

最初由 dongxi 发表
[B]
第一个问题:
统计中如何解决分层数据与分类资料混合的问题??
举例来说:


压痛


反跳痛

有 程度




压痛与反跳痛的无、有属于分类数据,但反跳痛的程度轻、中、重却是分层资料。
有时量表的统计往往将他们混在一起。这样合理吗?如果不合理,应该怎么办才算合理?

第二个问题:
在上例中,除了数据性质的问题,还有数据层次的问题,反跳痛的程度数据与反跳痛的无、有数据显然处于不同的层次,自然也与压痛的无、有处于不同的观察层次,这种层次会影响统计方法的选用吗?
处理这种树状结构的数据,用多元统计方法可行吗?如果多元统计不可行的话,人工智能可行吗?如果这个树状分支继续延伸呢?
[/B]


如果就事论事地回答,这二个问题也可以看作是同一层次的分类。分类原则为:
反跳痛:{0,轻,中,重}。

从统计学角度讲无所谓合理不合理,判断合理与否取决于医学语义及认知目标。

如果真遇上所谓“分类”与“分层”混合资料,可以用所谓逻辑-统计学方法解决。模式识别中常用这方法。

BMKI试图建立一个逻辑与统计整合的算法,但至今未获进展.
发表于 2004-11-7 21:17:01 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

最初由 dongxi 发表
[B]
于是就有
医师A的触诊+医师B的视诊 显然不等于 医师A的触诊+医师A的视诊。
不仅这样,还有,
医师A的左手触诊+医师A的视诊 也不等于 医师A的右手触诊+医师A的视诊
更有,
60岁医师A的左手触诊+医师A的视诊 也不等于 61岁医师A的左手触诊+医师A的视诊

如果为了实现完全精确的量化,必须记下多少参数呢?除了患者的各项参数,还有医师的年龄,性别,左右手,如果出现诊法组合的话,还要记录诊法一的医师参数,诊法二的医师参数……那是不是太复杂了呀? [/B]


"医师A的触诊","医师B的视诊"属于医生获得的带有主观性的信息,在病历数据类型中,有SOAP之分,S为病人的"主观陈述",医生发现被认为是客观的,不属于S。其实这不一定对。医生获得带主观性的信息不一定可靠。这问题在中医脉诊中大量存在。请10-20名脉诊高手来为一个病人诊脉,其一致性就可代表其可靠性。但可靠性或所谓知识硬度的大小最终取决于认知目标,这是我们MBKI一直在探讨的问题。例如有研究表明,一个血液科的技术员,如果其对骨髓细胞的识别的一致性能达到70%以上,这对血液科临床工作已经足够。
发表于 2004-11-10 23:02:52 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

医学分类及其运算的信息学变化相当复杂,视作为分类依据的属性集合是否具有整合性,何种性质的整合性而定。以下是生物医学知识整合论(BMKI)的一些初步研究(大部分发表于:包含飞:生物医学知识整合论(Ⅱ) ,《医学信息》杂志,2003,第16卷,第8期),现公布如下,以飨网友:

(1)无结构属性集合:

对一群人按不相关属性集合{打篮球,踢足球,游泳,骑马,弹琴,下棋,唱歌,绘画,赋诗}分组:
第1组:打篮球∧踢足球∧弹琴∧唱歌;
第2组:游泳∧骑马∧弹琴∧下棋;
第3组:足球∧唱歌∧绘画∧赋诗。
   …….

(2)有结构属性集合:

◆意识力的结构:属性的抽象层次及其结构:
一篇关于UMLS语义网络的论文[20]中指出:高层语义类型之间中的关系,一般可通过is_a连接继承给其子类型。例如,在语义类型“生物学功能”和“机体”之间存在着“是…的过程”关系(即“生物学功能是机体的过程”),所以,“器官或组织功能”(is_a“生理功能”,后者又is_a“生物学功能”)和“动物”(is_a“机体”)之间也存在着“是…的过程”关系。(即“器官或组织功能是动物的过程”)然而语义类型之间的关系对属于这些语义类型的概念的所有实例之间并不一定都适合。也即这一关系在所有的具体的概念对之间可能存在,也可能不存在。例如,虽然“是…的值”关系存在于“体征”和“机体属性”之间(即“体征是机体属性的值”),但一个具体的体征或一个具体的属性之间可能不存在这种关系。例如体征“超重”和“发热”可能是机体属性“体重”和“体温”的值,但“超重”不是“体温”的值,“发热”不是“体重”的值。因为“体征是机体属性的值”在一定抽象粒度上是成立的,但当“体征”及“机体属性”被具体化到“超重”,“发热”,“体温”,“体重”,关系就不一定成立。BMKI常说,确定性或精确性决定于意识性或物理性认知目标,抽象程度的提高用概念的模糊性增加换来了判断关系的确定性,也即用牺牲物理精确性的方法换取意识的确定性。(见图7)

◆物理力的结构:例如以下二个例子的定义属性集合的演绎结构本身由种系发生(物理力)决定的。

如以下定义属性集合的演绎结构“生命体 > 生命体∧神经组织 > 生命体∧脊椎∧神经组织 > 正常∧生命体∧脊椎∧哺乳∧神经组织 > 正常∧生命体∧脊椎∧哺乳∧神经组织∧高级NS”决定了图4的分类体系。
而定义属性集合的演绎结构“生命体 > 正常∧生命体∧功能 > (复合体∧正常∧生命体)∧功能 > (复合体∧正常∧生命体∧高级NS)∧功能” 决定了图6的分类体系。

(图7,图4,图6请农夫贴到本讨论上,图已经由e-mail发给农夫,谢谢!).
发表于 2004-11-12 12:43:50 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

图7:
发表于 2004-11-12 12:44:46 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

图4:
发表于 2004-11-12 12:45:21 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

图6:
发表于 2004-11-12 13:39:07 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

[B]谢谢农夫每次的热心帮助![/FONT] [/SIZE] [/COLOR][/B]
 楼主| 发表于 2004-11-12 22:55:57 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

传统统计学只能解决非结构性的数据处理问题,
意识力结构和物理力结构、使生物机体属性出现了传统统计学无法处理的数据属性,但目前,又未有更有效的解决方法。
 楼主| 发表于 2005-2-15 10:35:34 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

终于将“泛化”、“结构爆炸”、“黑箱”这几个概念联系起来了。
还参考了一本书《机器学习与数据挖掘:方法和应用》电子工业出版社ISBN 7_5053-9224-7
发表于 2005-2-15 11:35:16 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

最初由 dongxi 发表
[B]终于将“泛化”、“结构爆炸”、“黑箱”这几个概念联系起来了。
还参考了一本书《机器学习与数据挖掘:方法和应用》电子工业出版社ISBN 7_5053-9224-7 [/B]



值得祝贺!

如再与认知目标(可表示为一个集合)联系起来,就较为完整。黑箱就有可能变为“白箱”,因为不存在离开认知目标而独立的“粒度”或“黑箱”;

如果加上“语义关系的物理运算属性”(物数学),也许“结构爆炸”或“机制爆炸”就可能成为可控情况。
 楼主| 发表于 2005-2-15 16:35:49 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

最初由 老包 发表
[B]黑箱就有可能变为“白箱”[/B]

哈,包老师,的确也想到了中医证候研究白箱化的问题
发表于 2005-2-15 17:54:36 | 显示全部楼层

最近在想 电子病历的时候 掉进了死胡同

最初由 dongxi 发表
[B]哈,包老师,的确也想到了中医证候研究白箱化的问题 [/B]



认知目标[B]决定[/B][/SIZE] 所需要的认知背景空间(对推理来说,这个空间是一个公理系统;对联想来讲,这个空间是一个“大或”空间);而认知空间[B]决定[/B][/SIZE]事物(元素和关系)的粒度(事物的详尽程度是否足够?是黑箱?灰箱还是白箱?有多灰?),命题是否确定地成立?

这两个[B]“决定”[/B][/SIZE] 关系是近来BMKI一直在探索的问题,并得出的重要结论。目前医学信息学界的医学知识工程领域显然对这个问题没有足够的认识。只是一味跟随人工智能的发展后面跑。努力建立各种各样的知识本体学并没有错,问题本体只有相对观念,没有绝对观念。试想有一天我们把世界的本体全部弄清楚了,我们还有生存的必要吗?

一切决定于认知目标,如果给我一个命题要回答yes or no(认知目标):"人在没有任何保护情况下生活在1000度高温的环境中一天",我就可以确定地说“no”。因为对这个认知目标来说,告诉我的内容是个完全白箱,粒度足够有余,我不需要任何更多的生物化学的知识。
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

快速回复 返回顶部 返回列表