数据集概览
定义:病理全切片数字图像及诊断报告数据集是由长沙朗慧信息科技有限公司整合的高质量病理数据。涵盖20倍及以上扫描倍率的WSI(Whole Slide Image)全切片数字图像及完整病理诊断报告,含免疫组化(ER/PR/HER2/Ki-67)、TNM分期等关键信息。
| 数据集名称 | 病理全切片数字图像及诊断报告数据集 |
| 数据总量 | 大量WSI全切片数字图像 |
| 数据类型 | WSI图像(20倍+)+ 病理诊断报告 |
| 数据来源 | 转卖 |
| 授权方式 | 转授权 附带完整授权文件 |
| 核心标注 | 免疫组化(ER/PR/HER2/Ki-67)、TNM分期、组织部位、手术方式 |
| 扫描倍率 | 20倍及以上高倍率数字病理扫描 |
核心数据字段
每份数据包含完整的结构化字段,覆盖从原始数据到专业诊断的全部需求。
| 字段类别 | 字段数 | 典型字段 |
|---|---|---|
| WSI图像 | 6 | WSI文件、扫描倍率(20x/40x)、图像尺寸、金字塔层级、扫描仪型号 |
| 病理诊断 | 10 | 病理诊断全文、组织学类型、组织学分级、切缘状态、脉管侵犯 |
| 免疫组化 | 8 | ER/PR/HER2/Ki-67/p53/E-cadherin 状态/表达率/评分 |
| TNM分期 | 5 | T分期、N分期、M分期、总分期、AJCC版本 |
| 临床信息 | 4 | 组织部位、手术方式、标本类型(活检/切除)、患者年龄/性别(脱敏) |
数据样例展示
以下为脱敏后的结构化 JSON 样例,展示典型数据格式。
{
"case_id": "WSI-2023-0002345",
"meta": {"organ": "乳腺","procedure": "改良根治术","scan_mag": "40x"},
"pathology": {"dx": "浸润性导管癌,非特殊型","grade": "II级(Nottingham 6分)","margin": "阴性"},
"ihc": {"ER": "阳性(90%,3+)","PR": "阳性(70%,3+)","HER2": "阴性(1+)","Ki-67": "25%"},
"tnm": {"T": "T2(2.5cm)","N": "N1(1/12)","M": "M0","stage": "IIB"}
}AI 应用场景
病理AI辅助诊断
WSI图像训练深度学习模型,实现肿瘤区域自动检测、组织学类型分类和分级判定。
免疫组化智能判读
免疫组化染色评估数据训练AI,实现ER/PR/HER2/Ki-67自动定量评分。
TNM智能分期
综合病理和免疫组化信息训练TNM分期预测模型。
肿瘤微环境分析
WSI数据用于肿瘤浸润淋巴细胞等微环境特征自动量化。
病理远程会诊AI
支撑远程病理会诊平台的AI预审和辅助诊断。
病理质控自动化
训练切片质量自动评估模型和诊断一致性检测模型。
常见问题
WSI文件的格式和大小?
WSI文件为标准数字病理格式(SVS/NDPI等),单张切片通常在1-5GB。扫描倍率20x-40x。
免疫组化结果是否完整?
包含ER、PR、HER2、Ki-67等核心免疫组化指标的状态、表达率和评分,部分含FISH验证结果。
数据授权情况?
附带完整转授权文件,授权范围明确覆盖商业AI训练场景。
如何获取样本?
请联系长沙朗慧信息科技有限公司 DataAssetsAPI 平台。
需要定制化的医疗数据方案?
长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的医疗数据资产。合作50+以上医院,含复旦100类型医院。
数据样本预览 · 定制化数据方案 · 专业技术支持