找回密码
 欢迎注册
搜索
热搜: 活动 交友 discuz
查看: 2549|回复: 2

努力创造信息医学

[复制链接]
发表于 2005-8-25 22:56:03 | 显示全部楼层 |阅读模式
&nbsp; 有史以来,医生都是将知识、个人经验以及临床观察结合起来治疗患者。在过去50 年中,从分子水平理解疾病和健康的步伐加快,强有力的新诊断技术扩展了临床观察技巧,迅猛推进了医疗保健。对许多科学而言,随着知识总和的扩大,描述它们图像的复杂性也在提高,生命科学也不例外。在基因组革命的初期,关于基因和蛋白序列之间的关系人们知之甚少,许多难题聚集在一块,但是仍然有许多是孤立和分散的。遗憾的是,许多最新的发现加快了复杂性的提升速度,我们仍然要走很长的路。 <div>  一些最近的发现是极其令人吃惊的。例如,仅仅3年以前,分子生物学关于一个基因一种蛋白的见解还没有人提过,为什么DNA双链包含方向相反的蛋白编码区到现在为止也不清楚。不过,科学界已经有了一些基本共识,包括:</div><div>&middot;基于RNA干预的复杂调控网络;</div><div>&middot;作为蛋白结构一个控制点的转移变异和失真的作用;</div><div>&middot;细胞中许多极其重要的信息展示的复制计数非常少;</div><div>&middot;非常小的变异会对健康和疾病产生影响;</div><div>&middot;蛋白是多功能的,它们的活动取决于和周围的关系;</div><div>&middot;单核苷酸多态性(SNP)的丰富程度令人吃惊。</div><div>  其它发现包括朊病毒(能够传播疾病的小分子蛋白片段)和能够自行结合成新形式的自催化RNA分子。虽然这些发现每一个都澄清了以前观察所留下的问题,同时也增加了描述图像的复杂性。技术的进展促进这些发现的诞生,使得临床医学有可能产生新的处理方法。例如,微阵列密度的稳定提高、价格的降低以及其他mRNA谱技术也很有意义。也出现了几种很有前景的海量基因测序技术和完全数字化诊断成像技术,例如CAT、MRI、PET、X线以及超声诊断系统。</div><div>  这些实验室仪器的进展和信息技术发展的关键性走向也有密切关系,例如超低响应时间网络、计算机网格、高级数据挖掘、模式发现算法以及超高密度低价存储器。从过去几年的进展我们可以看到,有关代谢过程获取的信息量以及控制它们的基因表达模式的发展速度是史无前例的。这些信息对分析患者的层次和类别的方式产生深刻影响,发现一些以前认为表型似乎很类似的疾病从基因级别看却非常复杂。</div><div>  令人惋惜的是,这种信息爆炸几乎没有对个体患者的治疗发生影响,因为到目前为止还没有发布这种数据的基本信息设施,而且实际上也没有让研究人员和临床医生能够存取这些数据的终端工具。即使具备终端工具和基本信息设施,储存这些信息的标准也很少,而且也没有可以在医学研究单位和研究社团之间达成共享数据协议的机制。</div><div>幸运的是,扩大的生物学知识和推动知识发展的技术对数据管理的框架以及它们如何增长的方法都提出了建议。</div><div /><div>  数据分类的努力</div><div>适用于这种数据管理框架的术语学应该根据以下两大类信息进行预测:</div><div>&middot;产业级高通量观察 </div><div>&middot;由假设驱动的科学研究</div><div>  这两种类别信息的重要性在于:建造一幅完整的生物化学图像需要许多不同信息源。</div><div>第一大类:信息──高通量观察──涉及管理大量信息。包括由基因和蛋白序列、三维蛋白结构、mRNA表达谱(微阵列数据)、人口统计数据以及包括医学图像在内的病历构成。这些信息中的大多数是利用基因测序、mRNA谱建造以及X线晶体图形学生成的;多数临床信息是从保存的病例中获取的。</div><div>  第二大类:数据──假设驱动科学研究──是由不断增长的生命科学基础研究结果组成。</div><div>这两类信息的差异虽然很细微,但也很重要。工业化过程的设计要对复杂系统(例如,整个基因组序列)建立系统化的文档。相反,响应特定治疗方案产生的少量信息总体的向上和向下调控的量化术语假设驱动研究范畴。这样的试验往往产生大量相关数据;后来很容易发现,组织和储存这些数据成为现代生物学的最大挑战之一。满足这两类数据需要的管理框架从逻辑上讲非常复杂,其理由如下:</div><div>&middot;就它们包括许多不同格式、结构以及数据表达而言,数据源有很多不同种类(多源性);</div><div>&middot;对这样的系统构造一个界面的任务是复杂的;</div><div>&middot;由于缺乏某种抽象层面,研究人员个体需要能够熟练使用若干不同的查询系统;</div><div>&middot;构成这些信息基本架构的数据源很可能非常庞大,而且地域分布很分散;</div><div>&middot;&nbsp; 这些数据源的规模和发展速度使得复制和发行问题的解决令人却步。</div><div>在可以获取信息的大量设施之间发行临床信息也存在安全性挑战问题。例如,系统的设计必须防备别有用心的查询策略。如果就某个年龄、某种疾病以及居住在某个特定邮政编码地区的所有患者进行查询可能只查到1个人。对这种场合不论赋予纪录的身份保护级别是什么都应该有匿名承诺。信息设施也必须支持计算强度很大的应用程序的运行。这方面的例子可以来自医学图像比较、微阵列分析以及临床纪录的数据挖掘等不同领域。因为信息设施的不同部分具有不同的需求,最有效的解决方案是采用网格设计,这种设计的优点是可以发挥处于不同物理位置的许多机器的威力。</div><div>许多数据源本来就是分布在各地,必须能够综合起来形成单一的虚拟观察窗口。常见的例子是位于多个医学机构的分散的临床数据库的可视化。必须向需要查询这些数据源的研究者展示一个窗口,其地理边界透明。</div><div /><div>  三个实施阶段</div><div>  建造这样一体化的信息实施需要分三个阶段:</div><div>定义和部署完全无纸病历</div><div>  尽管许多高水平的数据库专家和建造者作了不懈努力,电子健康记录(EHR)开创性研究的发展速度一直不够快。例如,金融行业已经采用了一整套结构非常好的标准,可以记录、检索并转移金融信息和金钱。如果没有这些标准,在你所在的任何地方从自动提款机(ATM)上提取现金都是不可能的。医学界也需要一整套这样的标准来交换临床和基因组信息。</div><div>建造各个机构之间的电子链接</div><div>  这些电子链接的最佳描述是借助通信和数据处理网格,实现以后就可以共享大容量人口统计以及临床信息。虽然信息共享在科研界往往起到核心作用,它的地位尚不如治疗的地位那样明显。然而,搜索大量临床信息的能力,去比较治疗结果、人口统计、临床病史和当前疾病参数,同样有可能使得研究工作与治疗双方的价值增加。充分实现这种价值需要新型模式发现以及有关数据挖掘工具的使用。</div><div>  临床和研究数据库的链接</div><div>  大量的信息资源需要包括进来。所有生物医学研究领域均可以包括,因为它们都是互相关联的。许多这样的数据资源都包含有关细胞基本过程的信息,其形式是基因序列和表达谱、蛋白相互作用、已知的多态、蛋白结构、配体结合试验以及其他各种与生物医学和基因相关的详细信息。</div><div>初看起来,似乎这些信息大多数并不具有重要的临床意义。但是这些观察的角度基于目前的治疗特征和患者层次,而不是基于未来的更加全面的代谢观察。</div><div>  正是由于这样的系统的范围之广和复杂性加上目前缺乏一套基本标准才造成各种实施过程进展缓慢。不过,许多医学学术研究中心已经开始构筑他们自己的信息医学传播系统。今天,这些系统是有重大差别的。当系统普遍存在时,各个机构之间的合作将产生规范模式。</div><div>多个机构之间的联系对取得成功的关键作用是确切无疑的。即使目前最大的医学中心也无法治疗规模足够庞大的患者群体,使得他们自己的病历成为信息医学的唯一基础。这样的治疗必须能够从覆盖成百上千种疾病的数以百万计的病例中精选出来。患者必须来自很不相同的背景,包括范围很广的基因类型,而且对每一种基因类型系统必须包括数量足够的记录,才能生成具有统计意义的信息。</div><div /><div>  重新定义健康和疾病</div><div>  从大量数据库里挖掘临床和分子级信息的能力大小对于创建新的患者层次结构的意义重大。目前,多数疾病是按照表型方法描述的,实际上它们是具有许多亚型的复杂多基因疾病。例如,精神分裂症和抑郁症这样的心理疾病不应该被看作疾病,而应该看作由包含许多不同基因表达谱、不同基因组序列和不同病史的患者身上体现的表型。有朝一日,这些参数的特定组合将会形成新的分类规范的基础,到那时,有关健康和疾病的含义将大有改变,对新的药物和治疗手段的发现有深远意义。开始建造一种共享的信息实施并且促进信息医学实践的时代来到,开头几步已经迈出了。■</div><div>(译自《Bio-IT World》)</div>
发表于 2005-8-26 09:28:53 | 显示全部楼层

努力创造信息医学

<p>看了感觉长进不小</p>
发表于 2005-8-27 04:50:54 | 显示全部楼层

努力创造信息医学

顶楼文章的观点无疑是正确的,但并不充分。因为它还是只看到诸如“不同格式、结构以及数据表达”,互操作“界面”,“数据源…非常庞大,地域分布很分散”等广义的信息语法层次,没有看到广义的信息语义层次,所以“虽然信息共享在科研界往往起到核心作用,它的地位尚不如治疗的地位那样明显”,这是因为科研特别是基础研究容易利用数据的语义。而临床诊断和治疗难以应用这些语义。
<br>
<br>真正的信息医学诞生要体现在二个方面:
<br>(1)        信息广义语法(如存储和传输格式)的整合,现在全球千军万马都在这一领域中奋战,包括SNOMED,HL7,Web本体,…,或将出现的其他新形式;
<br>(2)        信息广义的语义整合,它涉及许多有关知识的理论探索,独立于上述语法研究,与广义的信息语法研究本质上是无关的。包括我们的生物医学知识整合论(BMKI)。现在全球几乎都对此麻木不知,或袖手旁观。所以BMKI及我们论坛是当今世界的一枝独秀。
<br>   
<br>只有语义整合研究才能最后把的“临床表型”为基础的传统医学转化为以“数据表型”为基础的信息医学。
<br>
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

快速回复 返回顶部 返回列表