数据集概览
中药与方剂结构化数据集是由长沙朗慧信息科技有限公司依托 DataAssetsAPI 平台构建的中医药知识数据仓库。汇集 200 万+条来自《中国药典》、中医药高等院校教材、中药鉴定标准及医院制剂备案的中药与方剂结构化信息。覆盖中药材基础属性、方剂配伍关系、炮制与制剂全链条,支持中医药 AI 模型训练、智能方剂推荐与中药鉴定研究。
| 数据集名称 | 中药与方剂结构化数据集 |
| 数据总量 | 200 万+条 中药/方剂/自制剂记录 |
| 中药品类 | 植物药、动物药、矿物药、菌类药全品类覆盖 |
| 方剂收录 | 经典方剂(伤寒论/金匮要略等)+ 现代医院协定方 + 备案自制剂 |
| 来源数据 | 《中国药典》2020版、中医药高校教材、中药鉴定标准、医院制剂备案信息 |
| 数据类型 | 结构化 JSON + 中药鉴定图谱 + 方剂歌诀文本 |
| 炮制方法 | 净制、切制、炒法、炙法、煅法、蒸煮燀法全覆盖 |
| 道地产区 | 道地药材产区标注(四大怀药、浙八味、关药、川药等) |
| 字段覆盖 | 10+ 核心维度,覆盖中药材全生命周期数据 |
| 格式输出 | 结构化 JSON + CSV 导出 + API 接口 |
字段维度体系
数据集按中医药信息学标准组织,覆盖从中药材基源到临床应用的完整链路。
| 维度大类 | 字段数 | 典型字段 | 价值层级 |
|---|---|---|---|
| 中药基础 | 8 | 中药名称(中文正名)、拉丁学名(属名+种加词)、药材基源、药用部位、采收季节、产地分布、商品规格 | 基础标识 |
| 性味归经 | 6 | 四气(寒/热/温/凉)、五味(酸/苦/甘/辛/咸)、归经(12经脉)、升降浮沉、毒性分级、配伍禁忌(十八反/十九畏) | 核心属性 |
| 功效分类 | 8 | 功效大类(解表/清热/泻下/祛风湿/化湿/利水渗湿/温里/理气/消食/驱虫/止血/活血化瘀/化痰止咳平喘/安神/平肝息风/开窍/补虚/收涩/涌吐/攻毒杀虫止痒/拔毒化腐生肌)、功效描述 | 功能标签 |
| 方剂组成 | 12 | 方剂名称、方剂来源(典籍/现代)、组成药物、君臣佐使配伍关系、剂量配比、功效主治、用法、方歌、加减化裁、现代应用、药理研究摘要、方剂分类 | 核心数据 |
| 炮制方法 | 8 | 炮制方法分类、具体工艺参数(温度/时间/辅料比例)、炮制目的、炮制前后性味归经变化、质量标准(水分/灰分/浸出物/含量测定)、炮制规范编号 | 加工工艺 |
| 鉴定特征 | 10 | 性状鉴定(形状/大小/表面/颜色/质地/断面/气味)、显微鉴别(组织/粉末特征)、理化鉴别(TLC/HPLC指纹图谱)、DNA条形码序列 | 质量溯源 |
| 药理活性 | 8 | 活性成分、药理作用、作用靶点、药代参数、毒理数据、临床试验证据(文献PMID关联)、构效关系摘要 | 药理学信息 |
| 道地产区 | 6 | 道地产区名称、地理坐标范围、气候特征、土壤类型、栽培技术要点、药材GAP基地 | 产区溯源 |
| 自制剂 | 8 | 制剂名称、备案号、处方组成、剂型、功能主治、用法用量、配制单位、批准日期 | 医院制剂 |
| 元数据 | 6 | 数据收录日期、最近更新日期、数据来源、质量评级、完整度评分、版本号 | 质量管理 |
脱敏 JSON 数据样例
以下为经脱敏处理的结构化 JSON 样例,中药/方剂/自制剂各维度数据完整保留。
{
"tcm_id": "TCM-2025-G3H7K2M8A1",
"chinese_name": "黄芪",
"latin_name": "Astragalus membranaceus (Fisch.) Bge. var. mongholicus (Bge.) Hsiao",
"family": "豆科 Fabaceae",
"medicinal_part": "根",
"harvest_season": "春、秋二季采挖",
"nature_flavor": {"four_qi": "温", "five_flavors": ["甘"], "toxicity": "无毒"},
"channel_tropism": ["肺经", "脾经"],
"efficacy_category": "补虚药/补气药",
"efficacy": "补气升阳,固表止汗,利水消肿,生津养血,行滞通痹,托毒排脓,敛疮生肌",
"processing_methods": [
{"method": "净制", "description": "除去杂质,大小分开,洗净"},
{"method": "炙黄芪", "description": "取黄芪片,加炼蜜及适量开水拌匀,文火炒至深黄色不粘手,每100kg用炼蜜25kg"}
],
"geo_authentic_regions": ["山西浑源", "甘肃陇西", "内蒙古武川"],
"identification": {
"shape": "圆柱形,上粗下细,表面淡棕黄色或淡棕褐色",
"odor": "气微", "taste": "味微甜,嚼之有豆腥味",
"microscopy": "纤维成束,壁厚,表面有纵裂纹;具缘纹孔导管多见"
},
"chemical_constituents": ["黄芪甲苷(astragaloside IV)", "毛蕊异黄酮葡萄糖苷", "黄芪多糖"],
"pharmacology": {
"activity": ["免疫调节", "抗疲劳", "抗心肌缺血", "降血糖"],
"targets": ["TLR4", "NF-kB", "AMPK"]
},
"formula_associations": [
{"formula_name": "补中益气汤", "source": "《脾胃论》", "role": "君药"}
],
"version": "2025Q1",
"quality_score": 97.5
}AI 应用场景
中医药大模型 SFT 训练
200万+条中药/方剂数据覆盖中医基础理论各维度,支持中医专用大模型微调与 RLHF 对齐,构建从辨证到论治的完整推理链路。
智能方剂推荐与配伍推理
方剂君臣佐使配伍关系 + 功效主治数据训练方剂推荐模型,实现证型-治法-方剂的智能映射与个体化加减化裁。
中药鉴定 AI
性状鉴定文本 + 显微鉴定特征 + DNA 条形码序列数据支持多模态中药鉴定模型训练,实现中药真伪优劣智能鉴别。
中药药理知识图谱
中药-活性成分-作用靶点-药理活性-临床证据关系链构建中药药理知识图谱,支持中药现代化研究与新药发现。
炮制工艺标准化研究
炮制方法参数 + 炮制前后成分变化数据训练炮制工艺质量预测模型,辅助炮制规范优化。
中药处方智能审核
配伍禁忌(十八反/十九畏)+ 毒性中药管理数据训练处方审核 AI,辅助中药临床安全用药。
常见问题
数据如何保证药材基源准确性?
中药材名称和拉丁学名严格遵循《中国药典》2020版和《中华本草》标准,经中医药专家交叉比对校验。同物异名、同名异物现象已做歧义消解和知识对齐。
炮制方法数据的粒度如何?
涵盖 20+ 大类炮制方法(净制/切制/炒法/炙法/煅法/蒸煮燀法等),每种炮制方法记录完整工艺参数(温度/时间/辅料比例/火候判断标准)及炮制目的与质量指标。
方剂数据是否包含现代临床应用?
经典方剂关联现代临床研究文献(PMID),记录加减化裁方案与现代适应症映射。自制剂数据来源于医院制剂备案信息,包含完整的处方组成与质量控制标准。
道地产区数据是否有地理信息?
道地产区标注到县级行政区,部分附带 GIS 经纬度坐标及气候/土壤数据,支持道地性空间分析与产区适宜性评价。
如何获取数据或商务咨询?
本数据集由长沙朗慧信息科技有限公司旗下 DataAssetsAPI 平台运营。支持按品类、按维度定制化交付。请联系我们获取详细数据目录和报价方案。
需要定制化的数据方案?
长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的数据资产。支持按维度、质量等级、数量规模灵活组合。
数据样本预览 · 定制化数据方案 · 专业技术支持