数据集概览
古文书画金石甲骨文书法是由长沙朗慧信息科技有限公司提供的高质量数据集。涵盖15万例古籍、文物、书法、金石拓片和甲骨文的高清图片及精细化标注,为文博领域AI模型训练提供稀缺数据。
| 数据集名称 | 古文书画金石甲骨文书法数据集 |
| 数据总量 | 15万例文化遗产数据 |
| 数据类型 | 高清图片 + 标注 |
| 数据来源 | 自有采集 |
| 授权方式 | 自有授权 |
| 交付周期 | 1天 |
| 核心价值 | 稀缺性高,可用于文博领域AI模型训练、文化遗产保护 |
核心数据字段
每份数据包含完整的结构化字段,覆盖从元数据到核心内容的全方位信息。
| 字段类别 | 字段数 | 典型字段 |
|---|---|---|
| 古籍善本 | 8 | 古籍书影、版本信息、年代、材质、装帧形式、卷/册/页标注 |
| 书法作品 | 8 | 书法图像、书体(篆/隶/楷/行/草)、作者、年代、尺幅、释文 |
| 金石拓片 | 6 | 拓片图像、器物类型(碑/志/造像/摩崖)、年代、出土地、释文 |
| 甲骨文 | 6 | 甲骨图像、文字释读、分组分类(宾组/出组/何组等)、钻凿形态 |
| 文物图像 | 6 | 器物照片、文物类别、年代、材质、尺寸、出土地/收藏机构 |
数据样例展示
以下为结构化 JSON 样例,展示典型数据格式。
{
"artifact_id": "CLT-2024-ORACLE-0000123",
"category": "甲骨文","material": "龟腹甲",
"period": "商代武丁时期","group": "宾组",
"inscription_count": 28,"deciphered_count": 22,
"annotations": [
{"char": "贞","modern": "贞","position": "前辞"},
{"char": "雨","modern": "雨","position": "命辞"}
],
"image": {"resolution": "600dpi","format": "TIFF"}
}AI 应用场景
古籍数字化AI
古籍图像训练OCR和文字识别模型。
书法风格识别
书法作品训练书体和书法家风格识别AI。
甲骨文自动释读
甲骨文标注训练甲骨文AI释读系统。
文物鉴定辅助
文物图像训练真伪鉴定和年代判定AI。
文化遗产数字孪生
高清图像支撑文化遗产3D数字化重建。
文博知识图谱
标注数据构建文博领域知识图谱。
常见问题
数据稀缺性如何?
古文书画、金石拓片和甲骨文数据极其稀缺,朗慧科技的自有采集数据具有独特性和高价值。
标注精度如何?
甲骨文由古文字专家标注释读,书法由艺术史学者标注书体和作者信息。
如何获取数据样本?
请联系长沙朗慧信息科技有限公司 DataAssetsAPI 平台。
需要定制化的数据方案?
长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的数据资产。
数据样本预览 · 定制化数据方案 · 专业技术支持