大咖点评
在传统信息化阶段,数据是各信息系统的附属。随着信息系统范围的不断扩大,数据的全局性以及价值彰显,数据被作为资产来独立看待。既然是资产,就要建立相应的目标、制度、规则、流程来管控这一资源以确保在数据安全、合规的前提下提升数据的价值。这是数据治理的本意。这一话题,对于我们医院领域很有讨论的必要,我们不仅要关注各种具体的数据管理活动,也要充分重视数据治理体系的建立。 ——CHIMA副主任委员薛万国
数据治理到底在解决什么问题,或者想解决什么问题呢?
一直想搞明白,太难了
@刘敏超-301医院 敏超主任,您提了一个好问题。关于您发的车轮图,有以下演变供参考。
车轮里的内容,可能往往是IT部门先意识到了治理改进的必要性,以及业务方/临床在其中的主导地位,但存在着教育(提升认知)、引导和激活业务方的过程。只不过是DAMA对数据治理的理解(一级分类),这些方面之间也存在着大量的交叉和关联。跟HIT领域的认知有些许的不一样。
学院派的以图书情报学和跨行业的大数据纯理论研究为主。
国内数据治理配套解决方案还不是很成熟,仅仅就DAMA的车轮来说,还存在架构设计上的天生缺陷,也缺胳膊少腿儿。
@刘敏超-301医院 敏超主任,您的车轮图是国际数据治理协会定义的,该组织还定义了功能框架和演进的车轮图。具体的治理内容,我发个导图给您供参考啊!这还只是方法论层面,具体工作还是要理论结合实际、由简入深,有个成熟度逐步完善的过程。
个人感觉在十几个专项治理中,对元数据的治理是最核心和最基础的部分。元数据是关于数据的数据,我们很多基础工作往往被忽略,这一课还是要补上。还有数据安全有关的分级分类,也是在元数据层面要先定义好。
非常赞同,甚至可以说元数据驱动,贯穿数据的整个生命周期。
是的,可以说所有的治理活动都和元数据有关。所以说到底还是治理要从标准化先开始,标准化从元数据的业务标准、技术标准和操作标准先开始
不过肯定不是个单纯的技术问题,更大的障碍在于文化和政治方面,既然IT先有了认知,完全可以有选择地先动起来,同时连掐带哄,逐步把业务扶上正位
也就是说数据治理是融进日常业务工作的方方面面的,是指导我们日常信息化工作的一个理念思想和方法论,以及工具箱?
就像跑步健身,慢慢就会发现,不止是个怎么跑的问题,涉及到个人整个生活方式的改变。
赞同。虽然后续执行层面可能会有很多障碍,但是现在的现状是在底层的标准层面其实是缺失的,不光要有顶层设计,还是得有基础的方法论和相应的模型和规范。
标准也<<>p有个总体设计,很多地方可以参考openEHR的架构和方法。
Tute, I. Scheffner, M. Marschollek,A method for interoperable knowledge-based data quality assessment。
BMC Med Inform Decis Mak. 2021 Mar 9;21(1):93. doi: 10.1186/s12911-021-01458-1. PubMed PMID: 33750371; PubMed Central PMCID: PMC7942002
https://www.ncbi.nlm.nih.gov/pubmed/33750371/
比如,统一的业务词汇表的编制与维护就是如此,统一的通用数据集(数据词汇表)也是,哪怕是具体一个系统的数据字典的维护。
数据管理与治理书目推荐:
I have found “Navigating the Labyrinth” by Laura Sebastian-Coleman really helpful. The book is aimed at executives, so it gives a high-level view of the key principles of data management and governance. Sometimes its good to zoom out of the detail, think about the bigger picture and simultaneously understand how senior stakeholders might think about the issue at hand.
-- Miles Reah (2022)
Amazon.com: Navigating the Labyrinth: An Executive Guide to Data Management: 9781634623759: Sebastian-Coleman, Laura: Books
https://www.amazon.com/Navigating-Labyrinth-Executive-Guide-Management/dp/1634623754
Publisher: Technics Publications; First edition (May 14, 2018)
Language: English
Paperback: 208 pages
《迷宫导航:数据管理主管指南》,参考书目/工具书推荐:DAMA Dictionary of Data Management。
数据元确实很重要,是数据源头规范,但为啥大家都绕过了没做?比个例子说,就好比孩子已经出生了,现在又出个新标准,说孩子必须双眼皮高鼻梁大耳朵……
问题来了,各家是把孩子杀了重生一个呢,还是按标准给孩子大整容呢?
目前没人敢捅这个马蜂窝。
存在即合理,其实不是推倒重来。是在目前的应用架构下,拾遗补缺加强和完善对元数据的治理。为以后的数据综合利用提供新的管理工具。例如,昨天也在和卫宁研究院团队沟通,是否可对药品的主数据和参考数据建立一个元数据管理的标准。并在此基础上建立合理用药及药事服务的知识体系。相关元数据所有的数据和规则要素都可查询、可血缘追溯、可算法验证,进一步提高数据一致性以及算法的可解释性。这样就达到了这一领域的治理目标,如果方法证明可行,再扩展到其他领域。
数据元也分不同层次,就跟数据模型的层次划分那样(实质上是一回事),同样有物理、逻辑和概念级的数据元。
所以按照车轮模型,连最初始的数据元都没治理好,咋说数据治理呢?
只能是头痛治理头、脚痛治理脚啦。
连数据是个啥都不清不楚,往往是道听途说,还怎么可能正确地交换共享,处理和分析利用呢?
其实大家都在想和做数据治理,只是没按车轮模型去搞就是了,不断探索各种方法模式寻找局部解决方案
缺乏提前的规划设计,不同的治理措施和成果很难彼此协同,更难维系。
是的,都是局部或部分解决方案。目前还难以搞出个实用的整体解决方案,画在纸上挂在墙上的那种不算数。
比较可行的办法是,老人老办法,新人新办法。
就是已经出生的孩子(数据和生产数据的系统)就这样了,不用动它。从现在开始生的娃(研制的新系统产生的数据),都得按新标准执行。
等老人都死完了就只剩下新人了,标准就规范统一了,数据治理就有根基了。
可能更多适合的是HL7一贯坚持的黑箱原则。模块化,松耦合,直至邦联。比如,IHE关于EMPI的规范就有此类的考虑,标准化并不意味着全盘的单一化,这也是很多术语标准叫"参考标准"的缘故。
完美主义要不得,标准自身也在发展变化,也有自己的生命周期。符合相关标准的各类数据规范也同样在发展变化,更理性的做法是,向前兼容,最大限度利用,而不是去否定,或者搞一刀切。
宁主任提出了一个最为关键的问题,我觉得这就是理论和实践之间的差别,学院派和工程师。
朱处的文章提出两种模式:回顾和前瞻,既培养好已经生下来的孩子,也规划好后面要生的孩子,全了。
车轮子图也看了,回顾与前瞻治理模式也总结了,元数据重点也明确了,那么,我们真的就能做好自己医院的数据治理吗?现在做数据治理的公司遍地开花,我们能够找到合适的公司吗,怎么知道公司在医院数据治理的工作做好了呢?
指望公司,不是不可能,只是可能性比较小。我现在是结合项目做数据治理,这样既能有产出物,又可以提升质量。尤其是如质控平台,HRP这一类项目。
我就是想知道怎么样才能把自己医院的数据治理做好(或者说做成)?有句话怎么说的呢“读了那么多书还是过不好这一生”。
数据治理首先要懂数据的业务,公司提供工具就不错了,还指望他们懂业务和陪着变更各种模式,要么指望不上,要么成本太高。院长书记会花这钱来做这种基础工作吗?
每个医院的数据治理目标会一样吗?指标会一样吗?
目标应该一样,指标大部分一样,小部分可能有差异吧。业务相同,规范相同,管理模式基本相同(国家要求的标准同质化),所以指标大部分都相同的。
就像找对象(每个人都要找对象哈),如果大家的标准都是要找个好的(或者说合适的),那就真能找着了?换成数据治理就这么说:我们要搞数据治理,要治理得规范高质量,就能把医院的数据治理干好了?
所以我们讨论了那么多数据治理,是不是有点隔靴搔痒(有点飘呢),如何在各自医院落地?
How to Get Started with Data Governance
https://thecareerforce.com/data-governance-tutorial/
把握机会,发展能力,量身定制,从简单做起,步步为营,与时俱进,持续改进。
据说,DAMA这个轮子里,中心的数据治理跟周边的那些(如元数据管理、主数据和参考数据管理等)是对等的东西,都属于总括术语"数据管理"下的类目,只不过数据治理实际上可以支持所有其他方面的工作。并不是我之前想象的那样。
数据治理,通过委员会形式比较合适,数据治理是全院的事情方方面面, 纵向科室管理容易,横向比较难。
IT治理跟数据治理啥区别?
两回事哈。
因为对象不同,所以后面的一系列内容都不同了。
关于数据治理的实用短文,推荐DAMA英国分会主席的博客:
https://www.nicolaaskham.com/blog
数据治理讨论了一阵子,前面的车轮子图,治理模式,治理重点,但感觉仍然没有讨论清楚数据治理这事。至少有几个问题没有讨论清楚。对比“IT治理”(就是为鼓励IT应用的期望行为而明确的决策权归属和责任担当框架。IT治理需要解决三个核心问题:需要做什么决策,谁来做决策,如何做决策及如何监督)。那么,数据治理也需要解决这三个核心问题,我们前面都没有讨论到这些呢?
治理这个词蛮有意思的,值得仔细玩味。
说道数据治理,需要仔细理解“治理”这个词的含义,为什么不说“管理”?另外,与治理结合的还有“IT治理”“政府治理”…据我所知,“治理”这个词恰恰是从“政府治理”提出来的。
在政府治理里,治理的意义是解决权责制约监督各方面平衡的,是一种框架性的约定。
数据质量管理包含了数据治理的范畴,数据治理是数据质量管理的一部分。“数据质量管理”探讨更广义的数据质量问题。从字面理解,数据质量管理更偏向信息系统从诞生到消亡全过程的数据管理,数据治理更偏向已产生数据的系统数据质量问题纠正和改进。
IT治理也是这样,说明治理这个词有特定的所指,因此数据治理也应该是解决数据方面权利责任的一种框架性约定。
简单粗暴地说,管理是针对常态的运作模式,治理是针对存在问题的运作模式。
管理是一种实践活动,是治理的具体执行过程。治理是一个类,而管理是类的一个实例,不知道对不对?
个人理解:数据治理是一项专项工作,就是将我们收集到的海量数据变为有用的信息,也就是为数据赋能的过程;经过数据治理的数据可以最大化地发挥有效的作用,可以更好地为医疗、医技、行政后勤人员的相关工作提供有效的技术支持,为病人提供高效、便捷的服务。
这就是为什么说,数据治理居于核心位置,跟其他方面又都密切相关,融入其中。
将中心位置换成管理会怎么样?
管理只是个总括性的概念,涵盖所有图中所示方面。
因为叠加了功能架构的内容,所以轮子演变了。
数据治理有12个分项治理环节。
以上讨论整理自CHIMA专家讨论群的技术交流。来源:CHIMA