数据集概览
医保结算与 DIP/DRG 数据集是由长沙朗慧信息科技有限公司依托 DataAssetsAPI 平台构建的医保支付知识数据库。汇集 1000 万+条来自医保结算系统脱敏处理的医保结算清单、DIP 病种分组与 DRG 分组编码数据,覆盖医保目录编码、药品/项目名称、支付标准、限制使用范围、就医类型、费用构成等全维度字段,支持医保智能审核、DIP/DRG 支付预测与医疗服务价格分析。
| 数据集名称 | 医保结算与 DIP/DRG 数据集 |
| 数据总量 | 1000 万+条 医保结算记录 |
| 覆盖类型 | 城镇职工医保、城乡居民医保、大病保险结算数据 |
| DIP 病种 | 按病种分值付费(DIP)分组编码与分值数据全覆盖 |
| DRG 分组 | CHS-DRG 1.2版分组编码、相对权重与费率数据 |
| 来源数据 | 医保结算系统脱敏数据、国家医保局公开目录、地方医保局公示数据 |
| 数据类型 | 结构化 JSON + CSV 导出 + API 接口 |
| 字段覆盖 | 14+ 核心维度,涵盖目录/分组/结算全链路 |
| 就医类型 | 住院、门诊慢特病、普通门诊、药店购药全覆盖 |
字段维度体系
数据集按医保信息业务编码标准组织,覆盖医保目录、支付方式、结算清单三大核心模块。
| 维度大类 | 字段数 | 典型字段 | 价值层级 |
|---|---|---|---|
| 医保目录 | 6 | 医保目录编码(YB编码)、药品/诊疗项目/耗材名称、剂型、规格、医保支付标准、甲乙类标识 | 基础目录 |
| 限制使用 | 4 | 限制使用范围(限适应症/限医院级别/限支付天数)、单次最大用量、年度限额、先行自付比例 | 支付规则 |
| DIP分组 | 6 | DIP病种分组编码、病种名称、分值、结算点值、入组条件(主要诊断+主要操作组合)、并发症合并症细分 | DIP核心 |
| DRG分组 | 8 | DRG分组编码(MDC+ADRG+DRG)、DRG名称、相对权重(RW)、费率、平均住院日、高低倍率界限、排除诊断编码 | DRG核心 |
| 结算清单 | 10 | 结算清单号、就医类型(住院/门诊/药店)、主要诊断ICD编码、其他诊断ICD编码、手术操作ICD-9-CM-3编码、入院日期、出院日期、实际住院天数、就诊机构级别、就诊机构类型 | 清单核心 |
| 费用构成 | 10 | 医疗总费用、医保统筹支付、大病保险支付、医疗救助支付、个人自付(自付一+自付二)、个人自费、药品费、检查费、治疗费、耗材费 | 费用分析 |
| 就诊机构 | 4 | 机构名称(脱敏)、机构级别(三级/二级/一级/未定级)、机构类型(综合/专科/中医/社区)、所在地市 | 机构画像 |
| 元数据 | 6 | 数据收录日期、最近更新日期、数据来源、脱敏方法、质量评级、完整度评分 | 质量管理 |
脱敏 JSON 数据样例
以下为经严格脱敏处理的医保结算 JSON 样例,DIP/DRG 分组与费用构成完整保留。
{
"claim_id": "CLM-2025-D8F3K2S7M1",
"insurance_type": "城镇职工基本医疗保险",
"admission_date": "2025-03-12",
"discharge_date": "2025-03-19",
"actual_los_days": 7,
"institution_level": "三级",
"institution_type": "综合医院",
"primary_diagnosis": "J15.902",
"primary_diagnosis_name": "社区获得性肺炎,非重症",
"procedures": ["03.3101"],
"drg": {
"mdc": "ES1",
"adrg": "ES1",
"drg_code": "ES13",
"drg_name": "呼吸系统感染/炎症,伴合并症与并发症",
"relative_weight": 0.85,
"base_rate": 12000.00
},
"expenses": {
"total_cny": 8235.40,
"yibaotongchou_cny": 5432.10,
"dabing_cny": 0,
"yiliaojiuzhu_cny": 0,
"gerenzifu_cny": 2103.30,
"gerenzifei_cny": 700.00,
"drug_cny": 2450.00,
"exam_cny": 1800.00,
"treatment_cny": 2785.40,
"consumable_cny": 1200.00
},
"dip": {
"dip_group_code": "J15.9-ZZ",
"dip_group_name": "细菌性肺炎-住院",
"score": 78.2,
"settlement_point_value": 85.50
},
"version": "2025Q1",
"quality_score": 97.5,
"anonymization": "K-匿名化(k≥5)+差分隐私(ε=1.0)"
}AI 应用场景
医保智能审核 AI
医保目录编码+限制使用范围+支付标准数据训练医保智能审核模型,实现处方/医嘱自动合规性审核与超限预警。
DIP/DRG 支付预测
DIP 分值+DRG 权重+费用构成数据训练支付预测模型,支持医保基金精算与医院成本管控。
医疗服务价格分析
药品/诊疗项目支付标准+历史中标价数据训练价格监测模型,辅助医疗服务价格动态调整。
医保欺诈检测
结算清单+就医类型+费用构成数据训练异常模式识别模型,实现欺诈骗保行为智能检测。
医院运营决策支持
DRG 分组+平均住院日+费用结构数据训练医院运营分析模型,辅助科室绩效评价与资源配置优化。
分级诊疗效果评估
就诊机构级别+诊断+费用数据训练分级诊疗效果模型,评估基层首诊率与转诊合理性。
常见问题
数据是否涉及个人隐私?
所有数据经过严格脱敏处理(K-匿名化 k≥5 + 差分隐私 ε≤1.0),不包含姓名、身份证号、医保卡号等直接标识信息。就诊机构名称已做泛化处理。
DIP 与 DRG 分组数据是否覆盖最新版本?
覆盖 CHS-DRG 1.2 版和 DIP 2.0 版技术规范。数据持续更新,确保与医保支付改革推进同步。
是否包含多地区的医保数据?
数据覆盖全国多省市医保结算样本,已做地域平衡处理。支持按地区、医保类型、就医类型筛选。
医保目录数据时效性如何?
医保目录数据依据国家医保局年度调整同步更新,包含最新的医保目录编码(YB编码体系)和支付标准。
如何获取数据或商务咨询?
本数据集由长沙朗慧信息科技有限公司旗下 DataAssetsAPI 平台运营。支持按医保类型、DIP/DRG 分组、地域维度定制化交付。请联系我们获取详细数据目录和报价方案。
需要定制化的数据方案?
长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的数据资产。支持按维度、质量等级、数量规模灵活组合。
数据样本预览 · 定制化数据方案 · 专业技术支持