数据集概览
定义:住院期间全部文书是由长沙朗慧信息科技有限公司提供的医疗数据集。涵盖2000万份住院全周期文本和PDF文书,从入院记录到出院小结的全流程文书,包含病历质控和DRG/DIP支付相关数据,为住院AI全流程训练提供完整语料。
| 数据集名称 | 住院期间全部文书数据集 |
| 数据总量 | 2000万份住院文书 |
| 数据类型 | 文本 / PDF |
| 覆盖范围 | 住院全周期文书(入院→出院) |
| 特色价值 | 病历质控、DRG/DIP分析 |
| 授权方式 | 转授权 |
核心数据字段
每份数据包含完整的结构化字段,覆盖从原始数据到专业诊断的全部需求。
| 字段类别 | 字段数 | 典型字段 |
|---|---|---|
| 入院文书 | 6 | 入院记录、首次病程记录、护理评估单、知情同意书 |
| 在院记录 | 10 | 日常病程记录、查房记录、会诊记录、手术记录、麻醉记录、护理记录 |
| 检查检验 | 5 | 检查报告、检验报告、病理报告、影像报告、心电报告 |
| 出院文书 | 6 | 出院小结、诊断证明、费用清单、医嘱单、转科记录 |
| 质控/支付 | 4 | 病历质控评分、DRG分组、DIP分值、主要诊断选择依据 |
数据样例展示
以下为脱敏后的结构化 JSON 样例,展示典型数据格式。
{
"record_id": "INP-2023-0012345",
"admission": {"date": "2023-06-15","dept": "心内科","chief_complaint": "胸痛2小时","admission_dx": "急性冠脉综合征"},
"progress_notes": [{"date": "2023-06-16","type": "主治查房","content": "患者胸痛缓解..."}],
"discharge": {"date": "2023-06-22","final_dx": "急性非ST段抬高型心肌梗死","drg": "FM31Z","dip_score": 1895}
}AI 应用场景
住院AI全流程
全周期文书训练住院流程AI,实现智能病程记录和自动出院小结。
病历自动生成
海量文书训练端到端病历自动生成AI。
病历质控AI
质控标注数据训练病历质量自动评估模型。
DRG/DIP智能分组
DRG/DIP标注训练医保支付分组预测模型。
临床决策支持
全周期数据训练住院期间临床辅助决策AI。
病案首页自动编码
诊断-编码关联数据训练ICD自动编码模型。
常见问题
数据覆盖住院哪些阶段?
覆盖从入院、在院治疗、到出院的住院全周期文书,包含病程记录、手术记录、检查报告、出院小结等所有主要文书类型。
文书格式是怎样的?
提供文本(结构化/半结构化)和PDF两种格式,已脱敏处理去除患者隐私信息。
如何获取数据样本?
请联系长沙朗慧信息科技有限公司 DataAssetsAPI 平台。
需要定制化的医疗数据方案?
长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的医疗数据资产。合作50+以上医院,含复旦100类型医院。
数据样本预览 · 定制化数据方案 · 专业技术支持