数据集概览
定义:心电图波形图及诊断报告数据集是由长沙朗慧信息科技有限公司通过合规渠道获取的大规模心电数据集合。涵盖500万例标准12导联心电图波形图像及结构化诊断报告,含自动分析报告和医生审核诊断结论,形成机器+人工双标注的高质量训练数据。
| 数据集名称 | 心电图波形图及诊断报告数据集 |
| 数据总量 | 500万例心电图记录 |
| 数据类型 | 图像(12导联心电图波形)+ 文本诊断报告 |
| 数据来源 | 转卖(合作50+以上医院) |
| 授权方式 | 转授权 含三家三甲医院直接授权 |
| 导联配置 | 标准12导联(I、II、III、aVR、aVL、aVF、V1-V6) |
| 质量保证 | 机器自动分析 + 医生审核诊断 双标注机制 |
核心数据字段
每份数据包含完整的结构化字段,覆盖从原始数据到专业诊断的全部需求。
| 字段类别 | 字段数 | 典型字段 |
|---|---|---|
| 心电波形图像 | 12 | 12导联波形图像(I/II/III/aVR/aVL/aVF/V1-V6)、采样率、增益设置、滤波参数 |
| 自动分析报告 | 8 | 心率、PR间期、QRS宽度、QT/QTc间期、电轴、自动诊断结论(机器生成) |
| 医生审核诊断 | 6 | 审核诊断结论、窦性心律/房颤/室早/ST段抬高分类、医生级别、审核日期 |
| 患者基本信息 | 4 | 年龄分组、性别、检查日期、临床科室(均脱敏处理) |
| 质量标签 | 3 | 数据质量等级、噪声水平、伪差/干扰标识 |
数据样例展示
以下为脱敏后的结构化 JSON 样例,展示典型数据格式。
{
"ecg_id": "ECG-2023-00124589",
"meta": {"age_group": "40-50","gender": "男","department": "心内科"},
"auto_analysis": {"heart_rate": 72,"pr_interval": 160,"qrs_width": 88,"qtc": 410,"axis": 45,"auto_conclusion": "窦性心律,正常心电图"},
"doctor_review": {"conclusion": "窦性心律,正常心电图","abnormal_flag": false,"reviewer_level": "主治医师"}
}AI 应用场景
心电图AI自动诊断
500万例双标注心电数据训练深度学习模型,实现窦性心律、房颤、室性早搏、ST段异常等常见心电图异常的自动识别与分类。
心律失常智能筛查
基于12导联波形特征提取,构建心律失常自动筛查系统,适用于体检中心和基层医疗机构的大规模心电图初筛。
心内科临床辅助决策
整合心电图诊断与临床症状的AI模型,为心内科医生提供智能化辅助诊断建议,提升急性心梗等急症的早期识别率。
可穿戴设备心电分析
标准12导联数据用于训练和验证可穿戴设备(智能手表等)单导联心电的异常检测算法,提升消费级心电产品准确率。
心电信号质量评估
质量标签数据用于训练心电信号质量自动评估模型,自动识别伪差和噪声,提升远程心电监测可靠性。
心电远程诊疗平台
大规模心电数据支撑远程心电诊断平台的AI引擎建设,实现基层医院心电图的自动预判和危急值报警。
常见问题
心电图数据的格式是怎样的?
心电图波形以标准12导联图像形式提供,同时附带结构化的自动分析报告和医生审核诊断结论。图像格式为高清PNG/DICOM,诊断报告为JSON/XML结构化数据。
自动分析和医生审核的关系是什么?
每条心电图记录同时包含机器自动分析报告和医生审核诊断结论,形成双标注体系。两者的差异可用于模型的不确定性分析和置信度评估。
数据涵盖哪些心电图异常类型?
涵盖正常心电图、窦性心律失常、房性心律失常(房颤/房扑)、室性心律失常(室早/室速)、传导阻滞、ST-T改变、心肌梗死等。
数据是否涉及患者隐私?
患者个人信息已完成脱敏处理,仅保留年龄分组、性别、检查科室等非标识性信息。合作医院均为三甲级别。
如何获取数据样本或商务咨询?
本数据集由长沙朗慧信息科技有限公司旗下 DataAssetsAPI 平台运营。请联系我们获取详细数据目录、样本预览和报价方案。
需要定制化的医疗数据方案?
长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的医疗数据资产。合作50+以上医院,含复旦100类型医院。
数据样本预览 · 定制化数据方案 · 专业技术支持