中药与方剂结构化数据集

200 万+条中药/方剂/自制剂数据 | 拉丁学名 · 性味归经 · 功效分类 · 炮制方法 · 道地产区 · 药理活性

200万+
中药记录
10+
核心维度
经典+现代
方剂收录
医院备案
自制剂
药典+教材
数据来源

数据集概览

中药与方剂结构化数据集是由长沙朗慧信息科技有限公司依托 DataAssetsAPI 平台构建的中医药知识数据仓库。汇集 200 万+条来自《中国药典》、中医药高等院校教材、中药鉴定标准及医院制剂备案的中药与方剂结构化信息。覆盖中药材基础属性、方剂配伍关系、炮制与制剂全链条,支持中医药 AI 模型训练、智能方剂推荐与中药鉴定研究。

数据集名称中药与方剂结构化数据集
数据总量200 万+条 中药/方剂/自制剂记录
中药品类植物药、动物药、矿物药、菌类药全品类覆盖
方剂收录经典方剂(伤寒论/金匮要略等)+ 现代医院协定方 + 备案自制剂
来源数据《中国药典》2020版、中医药高校教材、中药鉴定标准、医院制剂备案信息
数据类型结构化 JSON + 中药鉴定图谱 + 方剂歌诀文本
炮制方法净制、切制、炒法、炙法、煅法、蒸煮燀法全覆盖
道地产区道地药材产区标注(四大怀药、浙八味、关药、川药等)
字段覆盖10+ 核心维度,覆盖中药材全生命周期数据
格式输出结构化 JSON + CSV 导出 + API 接口

字段维度体系

数据集按中医药信息学标准组织,覆盖从中药材基源到临床应用的完整链路。

维度大类字段数典型字段价值层级
中药基础8中药名称(中文正名)、拉丁学名(属名+种加词)、药材基源、药用部位、采收季节、产地分布、商品规格基础标识
性味归经6四气(寒/热/温/凉)、五味(酸/苦/甘/辛/咸)、归经(12经脉)、升降浮沉、毒性分级、配伍禁忌(十八反/十九畏)核心属性
功效分类8功效大类(解表/清热/泻下/祛风湿/化湿/利水渗湿/温里/理气/消食/驱虫/止血/活血化瘀/化痰止咳平喘/安神/平肝息风/开窍/补虚/收涩/涌吐/攻毒杀虫止痒/拔毒化腐生肌)、功效描述功能标签
方剂组成12方剂名称、方剂来源(典籍/现代)、组成药物、君臣佐使配伍关系、剂量配比、功效主治、用法、方歌、加减化裁、现代应用、药理研究摘要、方剂分类核心数据
炮制方法8炮制方法分类、具体工艺参数(温度/时间/辅料比例)、炮制目的、炮制前后性味归经变化、质量标准(水分/灰分/浸出物/含量测定)、炮制规范编号加工工艺
鉴定特征10性状鉴定(形状/大小/表面/颜色/质地/断面/气味)、显微鉴别(组织/粉末特征)、理化鉴别(TLC/HPLC指纹图谱)、DNA条形码序列质量溯源
药理活性8活性成分、药理作用、作用靶点、药代参数、毒理数据、临床试验证据(文献PMID关联)、构效关系摘要药理学信息
道地产区6道地产区名称、地理坐标范围、气候特征、土壤类型、栽培技术要点、药材GAP基地产区溯源
自制剂8制剂名称、备案号、处方组成、剂型、功能主治、用法用量、配制单位、批准日期医院制剂
元数据6数据收录日期、最近更新日期、数据来源、质量评级、完整度评分、版本号质量管理

脱敏 JSON 数据样例

以下为经脱敏处理的结构化 JSON 样例,中药/方剂/自制剂各维度数据完整保留。

{
  "tcm_id": "TCM-2025-G3H7K2M8A1",
  "chinese_name": "黄芪",
  "latin_name": "Astragalus membranaceus (Fisch.) Bge. var. mongholicus (Bge.) Hsiao",
  "family": "豆科 Fabaceae",
  "medicinal_part": "根",
  "harvest_season": "春、秋二季采挖",
  "nature_flavor": {"four_qi": "温", "five_flavors": ["甘"], "toxicity": "无毒"},
  "channel_tropism": ["肺经", "脾经"],
  "efficacy_category": "补虚药/补气药",
  "efficacy": "补气升阳,固表止汗,利水消肿,生津养血,行滞通痹,托毒排脓,敛疮生肌",
  "processing_methods": [
    {"method": "净制", "description": "除去杂质,大小分开,洗净"},
    {"method": "炙黄芪", "description": "取黄芪片,加炼蜜及适量开水拌匀,文火炒至深黄色不粘手,每100kg用炼蜜25kg"}
  ],
  "geo_authentic_regions": ["山西浑源", "甘肃陇西", "内蒙古武川"],
  "identification": {
    "shape": "圆柱形,上粗下细,表面淡棕黄色或淡棕褐色",
    "odor": "气微", "taste": "味微甜,嚼之有豆腥味",
    "microscopy": "纤维成束,壁厚,表面有纵裂纹;具缘纹孔导管多见"
  },
  "chemical_constituents": ["黄芪甲苷(astragaloside IV)", "毛蕊异黄酮葡萄糖苷", "黄芪多糖"],
  "pharmacology": {
    "activity": ["免疫调节", "抗疲劳", "抗心肌缺血", "降血糖"],
    "targets": ["TLR4", "NF-kB", "AMPK"]
  },
  "formula_associations": [
    {"formula_name": "补中益气汤", "source": "《脾胃论》", "role": "君药"}
  ],
  "version": "2025Q1",
  "quality_score": 97.5
}

AI 应用场景

中医药大模型 SFT 训练

200万+条中药/方剂数据覆盖中医基础理论各维度,支持中医专用大模型微调与 RLHF 对齐,构建从辨证到论治的完整推理链路。

智能方剂推荐与配伍推理

方剂君臣佐使配伍关系 + 功效主治数据训练方剂推荐模型,实现证型-治法-方剂的智能映射与个体化加减化裁。

中药鉴定 AI

性状鉴定文本 + 显微鉴定特征 + DNA 条形码序列数据支持多模态中药鉴定模型训练,实现中药真伪优劣智能鉴别。

中药药理知识图谱

中药-活性成分-作用靶点-药理活性-临床证据关系链构建中药药理知识图谱,支持中药现代化研究与新药发现。

炮制工艺标准化研究

炮制方法参数 + 炮制前后成分变化数据训练炮制工艺质量预测模型,辅助炮制规范优化。

中药处方智能审核

配伍禁忌(十八反/十九畏)+ 毒性中药管理数据训练处方审核 AI,辅助中药临床安全用药。

常见问题

数据如何保证药材基源准确性?
中药材名称和拉丁学名严格遵循《中国药典》2020版和《中华本草》标准,经中医药专家交叉比对校验。同物异名、同名异物现象已做歧义消解和知识对齐。
炮制方法数据的粒度如何?
涵盖 20+ 大类炮制方法(净制/切制/炒法/炙法/煅法/蒸煮燀法等),每种炮制方法记录完整工艺参数(温度/时间/辅料比例/火候判断标准)及炮制目的与质量指标。
方剂数据是否包含现代临床应用?
经典方剂关联现代临床研究文献(PMID),记录加减化裁方案与现代适应症映射。自制剂数据来源于医院制剂备案信息,包含完整的处方组成与质量控制标准。
道地产区数据是否有地理信息?
道地产区标注到县级行政区,部分附带 GIS 经纬度坐标及气候/土壤数据,支持道地性空间分析与产区适宜性评价。
如何获取数据或商务咨询?
本数据集由长沙朗慧信息科技有限公司旗下 DataAssetsAPI 平台运营。支持按品类、按维度定制化交付。请联系我们获取详细数据目录和报价方案。

需要定制化的数据方案?

长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的数据资产。支持按维度、质量等级、数量规模灵活组合。

数据样本预览 · 定制化数据方案 · 专业技术支持