民生数据资产

覆盖法律文书、法律题库、司法案例、民生场景、城市治理、民生服务六大核心领域,服务全国各级政府部门、法院检察院、城市管理机构, 经过严格质控体系验证,为智慧民生与法律AI提供高质量数据基础。

50万+ 法律文书 500+ 民生场景 100+ 城市治理
50万+
法律文书配对数据
50+
民事案由覆盖种类
50+
刑事罪名覆盖种类
99.9%
文书配对逻辑一致性

六大核心数据集

覆盖民生全场景,为智慧民生、司法AI、城市治理提供高质量数据基础设施

法律文书 | 50万+ 配对组

法律文书配对数据集

起诉状 + 答辩状 + 裁判文书三元配对数据,覆盖民事、刑事、行政、国家赔偿、执行等五大领域。每条文书包含完整案件事实、诉讼请求、事实与理由、判决结果等法定要素,经过严格脱敏和质控,适用于法律AI模型训练、司法文本生成、案件分析等场景。

≥60%
民事案件
≥20%
刑事案件
≥10%
行政案件
≥5%
国家赔偿
≥5%
执行及其他
2023-2026年数据 民事50+案由 刑事50+罪名 行政10+类型 脱敏合格率≥98%
查看数据结构详情
字段 说明
doc_id文书唯一标识
pair_id配对组ID,同一案件文书共享
doc_type文书类型(起诉状/答辩状/裁判文书等)
case_type案件类型(民事/刑事/行政/国家赔偿/执行)
cause_of_action案由标签(如"民间借贷纠纷""盗窃罪")
court_name受理法院全称
full_text脱敏后文书全文(纯文本)
法律题库 | 按案件复杂程度三级分类

法律题库数据集

基于真实案件提炼的法律专业知识题库,按案件复杂程度分为一般复杂、中等复杂、非常复杂三级。覆盖法律条文引用、争议焦点分析、证据链构建等核心考核维度,适用于法律职业资格考试训练、法官/律师能力评估、法律AI评测等场景。

一般复杂 占比30%

案件事实涉及多个争议焦点或多方法当事人,需要一定程度的法律分析与事实梳理

  • • 当事人2-3方
  • • 争议焦点2-3个
  • • 2-3部主要法律
  • • 标的额≥50万元
中等复杂 占比40%

多层次法律关系交织、多方利益冲突,需要综合适用多项法律制度

  • • 当事人3-4方
  • • 争议焦点3-5个
  • • 3-4部主要法律
  • • 标的额≥500万元
非常复杂 占比30%

涉及重大疑难法律问题、跨领域法律规则适用,需高度专业的法律分析

  • • 当事人4方以上
  • • 争议焦点5个以上
  • • 跨领域法律规则
  • • 复杂组织主体
法律条文引用 争议焦点分析 证据链构建 法律关系梳理 程序要求判断 法律适用分析
司法案例 | 典型案件深度标注

司法案例数据集

精选典型案例深度标注数据,每个案例包含完整案情事实、争议焦点拆解、法律适用分析、裁判要点提炼等多维度标注信息。覆盖民事、刑事、行政三大审判领域,为司法裁判辅助系统、类案检索、法律推理AI模型提供高质量训练数据。

民事案例
12大类59种案由
刑事案例
8大类50+罪名
行政案例
10种行政行为
多维度标注
事实+争议+适用+裁判
案情事实标注 争议焦点拆解 法律适用分析 裁判要点提炼 类案关联
民生场景数据 民生场景

民生场景数据集

500+ 民生场景数据,覆盖行政审批、公共服务、电子证照、民生热线等领域

  • 行政审批流程数据
  • 公共服务事项清单
  • 电子证照模板库
  • 民生热线问答数据
城市治理数据 城市治理

城市治理数据集

100+ 城市治理数据,覆盖城市规划、交通管理、环境监测、应急指挥等场景

  • 城市规划空间数据
  • 交通流量监测数据
  • 环境质量指标数据
  • 应急指挥预案库
民生服务数据 民生服务

民生服务数据集

50+ 民生服务数据,覆盖社保医保、教育就业、住房保障、养老服务等领域

  • 社保医保政策数据库
  • 就业岗位匹配数据
  • 住房保障申请数据
  • 养老服务资源库

五级质控验收体系

从数据来源合规到最终交付确认,全流程质量保障

1

来源合规审查

数据来源合法性验证,确保采集/存储/传输/交付符合《网络安全法》《数据安全法》《个人信息保护法》

2

脱敏质量检测

隐去公司名/人名/金额等敏感信息,保持文书法律逻辑完整,脱敏合格率≥98%

3

内容质量核验

格式完整性/法律适用准确性/逻辑一致性/文字规范性四维查验,合格率≥99.9%

4

覆盖范围验收

民事50+案由/刑事50+罪名/行政10+类型全覆盖,时间范围2023-2026年

5

唯一性验证

文书级/pair级重复率≤0.01%,跨pair内容重复率为0,确保数据唯一性

获取完整数据目录

我们的数据专家将根据您的具体业务场景,提供定制化的数据集推荐与试用方案