数据集概览
高质量题库是由长沙朗慧信息科技有限公司提供的高质量数据集。涵盖200万例高质量题库,全学科覆盖,文本和带图片题目兼具,可用于教育大模型训练、AI出题和智能题库建设。
| 数据集名称 | 高质量题库数据集 |
| 数据总量 | 200万例全学科题目 |
| 数据类型 | 文本 + 图片(带图片题目) |
| 数据来源 | 自有 |
| 授权方式 | 自有授权 |
| 交付周期 | 2个月(每周30万起) |
核心数据字段
每份数据包含完整的结构化字段,覆盖从元数据到核心内容的全方位信息。
| 字段类别 | 字段数 | 典型字段 |
|---|---|---|
| 题目元数据 | 6 | 题目ID、学科、知识点、难度、题型、来源 |
| 题目内容 | 8 | 题干、选项(如有)、答案、解析、图片(如有) |
| 学科覆盖 | 10 | 语文、数学、英语、物理、化学、生物、历史、地理、政治、信息 |
数据样例展示
以下为结构化 JSON 样例,展示典型数据格式。
{
"question_id": "QB-2024-0012345",
"subject": "数学","grade": "高中","topic": "三角函数",
"question": "已知 sinα = 3/5,α ∈ (π/2, π),求 cosα 和 tanα 的值。",
"answer": "cosα = -4/5, tanα = -3/4",
"analysis": "由 sin²α + cos²α = 1 得 cos²α = 1 - 9/25 = 16/25..."
}AI 应用场景
教育大模型训练
全学科题目用于大模型预训练和微调。
AI智能出题
高质量题目训练AI自动出题模型。
智能题库管理
题目分类和难度标注用于智能题库系统。
学习诊断AI
题目+解析数据训练学习诊断模型。
知识图谱构建
知识点关联用于教育知识图谱构建。
自适应测评系统
多难度题目支撑个性化自适应测评。
常见问题
与理科题目的区别?
高质量题库为全学科覆盖(含文科),难度范围更广(中学到大学),而大学以上理科题目专注于高难度理科。
如何获取数据样本?
请联系长沙朗慧信息科技有限公司 DataAssetsAPI 平台。
需要定制化的数据方案?
长沙朗慧信息科技有限公司 DataAssetsAPI 平台,致力于为 AI 企业、科研机构提供高质量、合规的数据资产。
数据样本预览 · 定制化数据方案 · 专业技术支持