找回密码
 欢迎注册
搜索
热搜: 活动 交友 discuz
查看: 10846|回复: 21

Miforum0505191900论坛数据挖掘

[复制链接]
发表于 2005-5-19 20:44:43 | 显示全部楼层 |阅读模式
加个图
发表于 2005-5-19 21:46:13 | 显示全部楼层

Miforum0505191900论坛数据挖掘

总结出什么规律了么?
发表于 2005-5-19 19:44:02 | 显示全部楼层

Miforum0505191900论坛数据挖掘

原始data如下,各位数据玩家,看看能挖掘什么信息出来吧?
论坛名称        帖子数        主题数
HL7研究        2474        382
电子病历技术        2274        251
HIS论坛        5232        603
医院CIO        1347        156
生物医学知识整合论        1025        142
医学信息标准化        447        62
Pacs系统应用        3033        459
DICOM技术论坛        1966        347
医学信息学研究        2712        444
国外参考        563        133
专业翻译切磋        589        74
学术杂谈        108        64
NoSA统计软件讨论        44        18
统计学讨论        175        38
健康报在线版        165        29
七七八八        2187        603
广告区        876        259
版务办公室        1000        165
认证交流        89        24
发表于 2005-5-19 22:16:54 | 显示全部楼层

Miforum0505191900论坛数据挖掘

这样的数据不能挖,只能统计,除非有IP地址,或用户名
发表于 2005-5-19 22:22:52 | 显示全部楼层

Miforum0505191900论坛数据挖掘

呵呵,把数字变成图形了。有没有其他的方法呢?discriptive statistics及其基础之上的挖掘?
发表于 2005-5-19 22:24:26 | 显示全部楼层

Miforum0505191900论坛数据挖掘

还是可以的,只要有方法,起码8020的规律已经看出来了吧
发表于 2005-5-19 22:33:37 | 显示全部楼层

Miforum0505191900论坛数据挖掘

进一步如果帖子和主题树木之间的比例说明一些问题的话,论坛之间的比较也能得出结论
发表于 2005-5-20 16:03:06 | 显示全部楼层

Miforum0505191900论坛数据挖掘

那就是统计了,能得出各论坛间的主题数或贴子数在统计学上有无意义,有无差别,用方差分析。
发表于 2005-5-20 16:38:29 | 显示全部楼层

Miforum0505191900论坛数据挖掘

版块内容需要调整,有些股份需要重组,有些股份需要破产,有些需要二次融资。
发表于 2005-5-21 01:29:05 | 显示全部楼层

Miforum0505191900论坛数据挖掘

挖掘结果:这些就是MIFORUM论坛定义的医学信息元数据现实版。
 楼主| 发表于 2005-5-21 09:39:27 | 显示全部楼层

Miforum0505191900论坛数据挖掘

据CBMdisc所载,从1984年到2004年6月,

国内共573名作者在153种期刊上发表了450篇关于电子病历的研究论文。

北京、广东、江苏、河北、上海、山东等地作者发表的论文超过总数的50%以上。

十分有趣的是,电子病历的研究者中有三分之一(146/450)来自部队。

电子病历的研究共获得17种科研基金共19次的资助。

收载论文的期刊主要是以下9种(见表),他们收载的论文占总数的50%。

电子病历类论文的期刊排名
杂志名称        论文篇数
中国病案        92
医学信息(西安)        38
中华医院管理杂志        27
中国医院管理        20
中国医药信息学术研究        12
中国医院        10
中国医院统计        9
解放军医院管理杂志        9
中国卫生事业管理        8
发表于 2005-6-24 15:31:11 | 显示全部楼层

Miforum0505191900论坛数据挖掘

这只能叫统计把。
<br>挖掘应该是2回事。
发表于 2005-8-31 17:41:18 | 显示全部楼层

Miforum0505191900论坛数据挖掘

1、网友比较关心的主题(这个主题是什么,他代表了什么或趋势、这个主题出现多长时间了,何时出现的,有什么现实意义和长远意义,大家关心的目的是什么、大家了解这一主题的渠道通畅有哪些等等)
<br>
<br>2、网友的类型分析
<br>
<br>3、如果有历史数据的话,还能看出某个主题在未来是否依然保持热度
<br>
<br>4。如果有网友对主题的关注记录,可以分析出哪些主题是过时的或没有必要的,哪些是需要重新定义或细分的,哪些是需要重点加强的
<br>
<br>5、通过实际发帖量和点击数的对比分析,可以有效利用论坛资源,发现资源消耗的关键点和主要活动的投入产出比例,从而为优化资源提供依据
<br>
<br>6、有些主题是不是在一段时间内,大家讨论的很热烈,而过了这段时间就没有了,时间性或季节性很强
<br>
<br>7、如何对主题进行优化组合
<br>
<br>8、如何保有网友和吸引新网友
<br>
<br>太多了,就先想这么多吧,欢迎大家补充!我也是今天和客户聊起了关于统计的问题,想到论坛来汲取点营养的!没想到启发了我的思路!
<br>
<br>谢谢大家!
<br>
<br>
发表于 2005-8-31 17:43:51 | 显示全部楼层

Miforum0505191900论坛数据挖掘

这是个很好玩的游戏!欢迎大家继续阿!
发表于 2005-8-31 17:57:15 | 显示全部楼层

Miforum0505191900论坛数据挖掘

再加两条,凑个整!
<br>9、对于一些突发事件如社会新闻等会使某一主题保持一定热度,因此要分析是什么类型的事件
<br>
<br>10、其他异常情况如某个主题理应有很多人关注,但实际人数很少,其具体原因是什么,而有些主题如广告不是论坛支持的,为什么有好多网友比较热衷
<br>
<br>呵呵!!!!!!!!
<br>
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

快速回复 返回顶部 返回列表