数据集概览
定义:医学文献/教科书知识库是由长沙朗慧信息科技有限公司通过合规渠道整合的海量医学知识数据集合。涵盖医学教科书章节、临床指南全文、医学综述文章、药物说明书等权威内容,为医疗大模型提供结构化的专业知识注入。
| 数据集名称 | 医学文献/教科书知识库 |
| 数据总量 | 海量权威医学内容 |
| 数据类型 | 文本(教科书/指南/综述/说明书) |
| 数据来源 | 转卖 |
| 授权方式 | 转授权 附带完整授权文件 |
| 内容类型 | 医学教科书、临床指南、医学综述、药物说明书 |
| 语言 | 中文为主 |
核心数据字段
每份数据包含完整的结构化字段,覆盖从原始数据到专业诊断的全部需求。
| 字段类别 | 字段数 | 典型字段 |
|---|---|---|
| 知识元数据 | 8 | 标题、来源类型(教科书/指南/综述)、学科分类、出版年份、版本、作者 |
| 分类体系 | 6 | 一级科室、二级专科、疾病分类(ICD编码)、知识类型、适用范围 |
| 教科书内容 | 12 | 章节标题、正文内容、知识点、图表说明、课后习题、参考文献 |
| 临床指南 | 10 | 指南名称、发布机构、发布时间、适应症、推荐等级、证据等级、关键建议 |
| 药物信息 | 8 | 通用名、商品名、剂型规格、适应症、禁忌症、不良反应、用法用量 |
数据样例展示
以下为脱敏后的结构化 JSON 样例,展示典型数据格式。
{
"knowledge_id": "MED-K-2024-0001523",
"meta": {"title": "急性心肌梗死的诊断与治疗","source_type": "教科书","book": "内科学(第9版)","chapter": "第四篇 第三章","publisher": "人民卫生出版社","year": 2018},
"content": {"section": "ST段抬高型心肌梗死(STEMI)","definition": "STEMI是指冠状动脉粥样硬化斑块破裂...","diagnosis": "持续性胸痛>30min + ECG相应导联ST段抬高 + 心肌酶学升高","treatment": "再灌注治疗(PCI/溶栓)+ 抗血小板 + 抗凝 + 他汀"}
}AI 应用场景
医学知识图谱构建
海量结构化医学知识为医疗知识图谱提供权威数据源,支持疾病-症状-药物-检查之间的语义关系建模。
医疗大模型知识注入
将医学教科书和临床指南作为预训练/微调语料,提升大模型在医疗领域的专业问答能力和诊断推理能力。
临床决策支持(CDSS)
基于临床指南和药物说明书构建CDSS规则引擎,为临床医生提供基于循证医学的辅助诊断和治疗方案推荐。
药物信息智能查询
结构化药物说明书数据用于智能用药助手训练,实现药物适应症、禁忌症、不良反应的智能查询与合理用药指导。
医学智能问答系统
丰富医学知识用于训练医学问答系统,支持面向患者和医务人员的智能医学咨询。
医学教育AI辅助
教科书和综述内容用于智能医学教育平台训练,辅助医学生系统学习和临床思维培养。
常见问题
数据库包含哪些类型的医学文献?
包括医学教科书(如《内科学》《外科学》统编教材)、临床指南(中华医学会各专科分会发布)、医学综述文章以及国家药监局审批的药物说明书。覆盖内科、外科、妇产科、儿科等主要临床学科。
数据是否已结构化处理?
所有数据已完成结构化加工,每篇文章/条目包含标题、来源类型、学科分类、正文内容等标准化元数据字段,可直接用于AI模型训练。
如何保证数据的权威性?
教科书来自人民卫生出版社等正规教育出版社,临床指南来自中华医学会等专业学会,药物说明书来自国家药监局审批版本。
数据是否涉及版权问题?
朗慧科技通过合规授权渠道获取数据,附带完整转授权文件。授权范围明确覆盖商业AI训练场景。
如何获取数据样本或商务咨询?
本数据集由长沙朗慧信息科技有限公司旗下 DataAssetsAPI 平台运营。请联系我们获取详细数据目录、样本预览和报价方案。
需要定制化的医疗数据方案?
长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的医疗数据资产。合作50+以上医院,含复旦100类型医院。
数据样本预览 · 定制化数据方案 · 专业技术支持