高质量题库

200万例全学科覆盖 | 文本+图片 | 教育AI训练核心语料

200万
题目总量
文本+图片
数据格式
全学科
覆盖
自有
数据来源
2个月
交付/每周30万起

数据集概览

高质量题库是由长沙朗慧信息科技有限公司提供的高质量数据集。涵盖200万例高质量题库,全学科覆盖,文本和带图片题目兼具,可用于教育大模型训练、AI出题和智能题库建设。

数据集名称高质量题库数据集
数据总量200万例全学科题目
数据类型文本 + 图片(带图片题目)
数据来源自有
授权方式自有授权
交付周期2个月(每周30万起)

核心数据字段

每份数据包含完整的结构化字段,覆盖从元数据到核心内容的全方位信息。

字段类别字段数典型字段
题目元数据6题目ID、学科、知识点、难度、题型、来源
题目内容8题干、选项(如有)、答案、解析、图片(如有)
学科覆盖10语文、数学、英语、物理、化学、生物、历史、地理、政治、信息

数据样例展示

以下为结构化 JSON 样例,展示典型数据格式。

{
  "question_id": "QB-2024-0012345",
  "subject": "数学","grade": "高中","topic": "三角函数",
  "question": "已知 sinα = 3/5,α ∈ (π/2, π),求 cosα 和 tanα 的值。",
  "answer": "cosα = -4/5, tanα = -3/4",
  "analysis": "由 sin²α + cos²α = 1 得 cos²α = 1 - 9/25 = 16/25..."
}

AI 应用场景

教育大模型训练

全学科题目用于大模型预训练和微调。

AI智能出题

高质量题目训练AI自动出题模型。

智能题库管理

题目分类和难度标注用于智能题库系统。

学习诊断AI

题目+解析数据训练学习诊断模型。

知识图谱构建

知识点关联用于教育知识图谱构建。

自适应测评系统

多难度题目支撑个性化自适应测评。

常见问题

与理科题目的区别?
高质量题库为全学科覆盖(含文科),难度范围更广(中学到大学),而大学以上理科题目专注于高难度理科。
如何获取数据样本?
请联系长沙朗慧信息科技有限公司 DataAssetsAPI 平台。

需要定制化的数据方案?

长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的数据资产。

数据样本预览 · 定制化数据方案 · 专业技术支持