附件下载:
WS/T 370—2022 卫生健康信息基本数据集编制标准(代替WS 370—2012)
卫生健康信息基本数据集编制标准
Standard for drafting of health information basic dataset
1 范围
本标准规定了卫生健康信息基本数据集的内容结构、数据集元数据、数据元属性、数据元索引和表示方法。
本标准适用于指导卫生健康信息相关数据集的编制与使用。
2 规范性引用文件
3 术语和定义
WS/T303、WS/T305、WS/T306、WS363.1、WS364.1中界定的以及下列术语和定义适用于本标准。
3.1 基本数据集basicdataset
在特定主题下,为了满足业务信息系统规范化建设和领域内部以及领域间数据交换与共享需求,设计归纳的各个子系统(或者功能模块)所包含的最小数据元素的集合。
4 缩略语
下列缩略语适用于本标准。
DCC 数据集类目编码(Dataset Classification Coding)
DE 数据元素(Data Element)
HDS 卫生领域数据集(Health Data Set)
5 内容结构
6 数据集元数据
6.1 数据集元数据选取
根据WS/T305中规定的7个元数据子集,本标准选取了核心元数据中的8个“必选(M)”元数据元素,分为2个元数据子集,对卫生信息基本数据集进行描述。WS305中的数据集核心元数据描述规范适用于本文件。
6.2 数据集描述格式
卫生健康信息基本数据集元数据采用表1的格式进行描述。
表1 数据集元数据
6.3 数据集标识符编码规则
数据集标识符采用字母数字混合码,结构为:数据集类目编码(DCC)_版本标识符(VI)。其中:
a)版本标识符(VI):结构由4部分组成,为“V”+“m..m”+“.”+“n..n”。其中,“m..m”和“n..n”为阿拉伯数字构成,在数学上应是具有意义的正整数。“m..m”表示主版本号,“n..n”表示次版本号。如果数据元更新前后可以进行有效的数据交换,则更新后主版本号不变,次版本号等于当前次版本号加1;如果数据元更新前后无法进行有效的数据交换,则更新后主版本号等于当前主版本号加1,次版本号归0。
b)数据集类目编码(DCC):即数据集分类编码。采用长度8位的字母数字混合码,含1位“.”。按业务领域代码、一级类目代码、二级类目代码、顺序号从左向右顺序排列。结构见图1。
图1中:
——业务领域代码:用3位大写英文字母表示。卫生健康信息领域统一用HDS表示。
——一级类目代码:用1位大写英文字母表示,从A开始顺序编码。
——二级类目代码:用1位数字表示,数字大小无含义。如有两个以上类目(含两个),从1开始顺序编码。如无二级类目,编为0。
——顺序号:用2位数字表示,代表二级类目下数据集的序号,数字大小无含义;从01开始顺序编码。顺序号与二级类目代码之间加“.”区分。数据集分类代码详见附录A。
7 数据元属性
7.1 数据元属性选取
根据WS/T303中规定的五类22项数据元基本属性中,本标准选取了五类14项数据元基本属性(见表2),对卫生健康信息基本数据集的数据元进行描述。
7.2 数据元描述格式
卫生健康信息基本数据集的数据元描述格式采用摘要式。在同一个数据集中,版本、注册机构、相关环境、分类模式、主管机构、注册状态、提交机构等7个数据元属性的值若完全相同(可称为数据元公用属性),则采用表3的描述格式集中描述,在数据元摘要式目录中可不再分述。
在同一个数据集中,内部标识符、数据元标识符(DE)、数据元名称、定义、数据元值的数据类型、表示格式、数据元允许值等7个数据元属性的值均不相同(可称为数据元专用属性),采用表4的摘要式目录描述格式进行描述。
表4 数据元专用属性描述格式
7.3 数据元属性描述规则
7.3.1 内部标识符
内部标识符指数据元在某特定数据集中的唯一标识代码。采用长度16位的字母数字混合码,含3位“.”。结构见图2。
图2中:
a)数据集类目编码(DCC):用8位字母数字混合码表示,编码规则见6.3b)。
b)子集顺序号:用3位数字表示,数字大小无含义;从001开始顺序编码。如无子集,编为000。子集顺序号与数据集类目编码之间加“.”区分;
c)数据元顺序号:用3位数字表示,代表数据元在数据集子集中的序号,数字大小无含义;从001开始顺序编码。数据元顺序号与子集顺序号之间加“.”区分。
7.3.2 其他属性
WS303、WS363.1、WS364.1中对数据元属性已做出的规范适用于本文件。
8 数据元索引和表示方法
数据元索引和表示方法如下:
——以数据集标准中的数据元名称作为索引项,同时给出数据元名称对应的内部标识符;
——以数据元名称首字的汉语拼音字母顺序编排,为了便于检索在数据元名称首字的汉语拼音首字母相同的索引项之上标出相应的字母;
——数据元名称为外文字母组成的,其前后顺序按照汉字、拉丁字母、希腊字母、阿拉伯数字的顺序编排。
附录A
(规范性)
卫生健康信息基本数据集分类代码
来源:中华人民共和国卫生行业标准,仅供学习用。