数据集概览
| 属性 | 说明 |
|---|---|
| 数据集名称 | 医学影像训练数据集 |
| 总规模 | 2000万+ 医学影像训练样本 |
| 覆盖模态 | CT · MRI · X光(DR) · 超声 · 内镜 · PET-CT · SPECT · 病理切片 · DSA · OCT |
| 任务类型 | 图像分类 · 目标检测 · 语义分割 · 实例分割 · 关键点检测 · 影像报告生成 · 图像配准 · 去噪增强 |
| 标注标准 | 双人独立标注 + 主任医师审核 + 病理金标准验证(有病理时) |
| 来源 | 自研/采集(三甲医院脱敏影像数据,授权运营) |
| 应用场景 | 模型预训练 · 模型微调 · 模型评测 |
| 供应形式 | 硬盘 · 云盘 · API · 数据基础设施 |
字段维度体系
| 类别 | 字段 | 说明 |
|---|---|---|
| 影像标识 | 影像ID · StudyUID · SeriesUID · SOPInstanceUID | DICOM标准唯一标识体系 |
| 模态属性 | 模态类型 · 解剖部位 · 图像尺寸 · 像素间距 · 层厚 | 影像物理属性与扫描参数 |
| 标注信息 | 标注类型 · 标注框/掩码 · 标注标签 · 标注者ID · 审核状态 | 医学标注结果与质控信息 |
| 临床参考 | 病理金标准 · 临床诊断 · 随访结果 · ICD编码 | 客观诊断参考标准 |
| 数据来源 | 采集机构 · 设备型号 · 采集时间 · 数据授权方式 | 数据溯源与合规信息 |
影像模态与标注任务分布
| 影像模态 | 典型解剖部位 | 标注任务 | 样本规模 |
|---|---|---|---|
| CT | 胸部 · 腹部 · 颅脑 · 脊柱 | 肺结节检测/分割、肝脏肿瘤分割、颅内出血分类 | 800万+ |
| MRI | 颅脑 · 膝关节 · 脊柱 · 前列腺 | 脑肿瘤分割、ACL撕裂检测、椎间盘突出分类 | 500万+ |
| X光(DR) | 胸部 · 骨骼 · 腹部 | 肺炎检测/分类、骨折检测、气胸识别 | 400万+ |
| 超声 | 腹部 · 甲状腺 · 乳腺 · 心脏 | 甲状腺结节TI-RADS分级、乳腺BI-RADS分级、心功能评估 | 120万+ |
| 内镜 | 消化道 · 呼吸道 | 息肉检测、早癌筛查、病变分级 | 80万+ |
| 病理切片 | 乳腺 · 肺 · 胃肠 · 宫颈 | 细胞核分割、肿瘤区域分类、免疫组化评分 | 100万+ |
脱敏 JSON 样例
{
"image_id": "IMG_CT_CHEST_2024Q3_0582134",
"modality": "CT",
"body_part": "chest",
"image_size": [512, 512, 321],
"voxel_spacing": [0.625, 0.625, 1.0],
"annotations": [
{"type":"bbox","label":"solid_nodule","coordinates":{"x":234,"y":187,"z":145,"w":18,"h":18,"d":3},"confidence":0.96},
{"type":"bbox","label":"ground_glass_opacity","coordinates":{"x":410,"y":298,"z":152,"w":24,"h":32,"d":5},"confidence":0.91}
],
"clinical_diagnosis": "右肺上叶实性结节(Lung-RADS 4A),建议3个月随访",
"annotator_id": "ANNO_RAD_0113",
"review_status": "approved",
"reviewer_id": "REVIEW_RAD_CHIEF_04"
}{
"image_id": "IMG_MRI_BRAIN_2024Q3_0128976",
"modality": "MRI",
"body_part": "head",
"sequences": ["T1","T1ce","T2","FLAIR"],
"image_size": [240, 240, 155],
"annotations": {
"type":"segmentation_mask",
"labels": {
"enhancing_tumor":{"voxel_count":38241,"volume_ml":14.9},
"peritumoral_edema":{"voxel_count":124562,"volume_ml":48.7},
"necrotic_core":{"voxel_count":15208,"volume_ml":5.9}
}
},
"pathology_report": "胶质母细胞瘤,WHO IV级,IDH野生型,MGMT甲基化阴性",
"gold_standard_source": "术后病理",
"review_status": "approved"
}{
"image_id": "IMG_XRAY_CHEST_2024Q3_0321456",
"modality": "X_RAY",
"body_part": "chest",
"view_position": "PA",
"image_size": [2160, 2560],
"annotations": {
"type":"multilabel_classification",
"labels": [
{"finding":"cardiomegaly","present":false},
{"finding":"pleural_effusion","present":true,"severity":"moderate"},
{"finding":"pneumonia","present":false},
{"finding":"pneumothorax","present":false}
]
},
"report_summary": "右侧中等量胸腔积液,建议超声定位穿刺引流",
"annotator_id": "ANNO_RAD_0207",
"kappa_score": 0.92
}{
"image_id": "IMG_US_THYROID_2024Q3_0087142",
"modality": "ultrasound",
"body_part": "thyroid",
"image_size": [512, 512],
"annotations": [
{"type":"contour","label":"thyroid_nodule","points":[[187,132],[195,128],...,[182,136]],"area_px":3241},
{"type":"classification","label":"TI-RADS_4b","criteria":[{"hypoechoic":true},{"irregular_margin":true},{"taller_than_wide":true}]}
],
"pathology_report": "甲状腺乳头状癌(FNA确诊,Brasilian Bethesda VI)",
"gold_standard_source": "细针穿刺活检",
"review_status": "approved"
}{
"image_id": "IMG_PATH_BREAST_2024Q3_0015248",
"modality": "pathology",
"body_part": "breast",
"stain": "H_E",
"magnification": "40x",
"image_size": [2048, 2048],
"annotations": {
"type":"instance_segmentation",
"nuclei": [
{"instance_id":1,"label":"epithelial","mask_rle":"...","area":452,"circularity":0.87},
{"instance_id":2,"label":"inflammatory","mask_rle":"...","area":321,"circularity":0.91}
],
"total_nuclei": 1247,
"tumor_stroma_ratio": 0.38
},
"diagnosis": "浸润性导管癌,组织学分级II级",
"gold_standard_source": "双人独立标注+病理专家审核",
"review_status": "approved"
}标注规范
双人独立标注
每例影像由两位影像科医师独立阅片标注,标注结果独立保存
病理金标准
有术后病理/活检的病例以病理为金标准,确保标注客观可靠
主任医师审核
争议样本由主任医师最终裁决,定期抽检复核标注质量
DICOM脱敏
完整剥离DICOM头文件中的患者身份信息,仅保留影像数据与临床诊断
AI 应用场景
病灶智能检出
肺结节、肝脏肿瘤、颅内出血等常见病灶的自动化检测与定位,提升影像科读片效率
器官/肿瘤分割
多模态影像的器官轮廓勾画与肿瘤边界精确分割,支持放疗靶区自动勾勒
影像报告自动生成
基于影像特征的自动结构化报告生成,减少影像科医师文书工作量
病变良恶性鉴别
肺结节Lung-RADS、甲状腺TI-RADS、乳腺BI-RADS等标准化分级智能评估
多模态影像融合
CT+PET-CT、MRI+T1+T2+FLAIR等跨模态影像配准与融合训练
疗效评估与随访
治疗前后影像对比分析,RECIST评估、肿瘤退缩自动量化等纵向随访模型
商业价值
降低AI研发成本
即用型标注数据集替代百万级影像标注外包,将医疗影像AI研发周期缩短50%+。
病理金标准保障
有病理的确诊病例以病理为金标准标注,模型训练效果显著优于仅影像标注。
合规安心
DICOM完整脱敏 + 授权运营 + 数据安全法合规,免除数据合规后顾之忧。
即插即用
提供DICOM+NIfTI双格式,标注支持COCO/YOLO/ITK-SNAP等多种标注格式导出。
常见问题
影像数据是否做了脱敏处理?
是的。所有影像均经过完整DICOM脱敏,剥离患者姓名、ID、出生日期、检查号等PHI信息,仅保留匿名标识、影像像素数据和临床诊断结果。
病理金标准是如何确认的?
有手术切除或穿刺活检的病例,以术后病理报告作为金标准;无病理的病例由两位影像科医师独立标注并交叉验证。
支持哪些标注格式导出?
影像文件为DICOM/NIfTI双格式,标注支持COCO JSON、YOLO txt、ITK-SNAP seg.nrrd、PASCAL VOC等通用格式,可无缝接入主流训练框架。
获取医学影像完整目录
2000万+训练样本 · 10大模态 · 多任务覆盖。联系数据专家获取详细影像清单与商务报价。