民生数据资产
覆盖法律文书、法律题库、司法案例、民生场景、城市治理、民生服务六大核心领域,服务全国各级政府部门、法院检察院、城市管理机构, 经过严格质控体系验证,为智慧民生与法律AI提供高质量数据基础。
六大核心数据集
覆盖民生全场景,为智慧民生、司法AI、城市治理提供高质量数据基础设施
法律文书配对数据集
起诉状 + 答辩状 + 裁判文书三元配对数据,覆盖民事、刑事、行政、国家赔偿、执行等五大领域。每条文书包含完整案件事实、诉讼请求、事实与理由、判决结果等法定要素,经过严格脱敏和质控,适用于法律AI模型训练、司法文本生成、案件分析等场景。
查看数据结构详情
| 字段 | 说明 |
|---|---|
| doc_id | 文书唯一标识 |
| pair_id | 配对组ID,同一案件文书共享 |
| doc_type | 文书类型(起诉状/答辩状/裁判文书等) |
| case_type | 案件类型(民事/刑事/行政/国家赔偿/执行) |
| cause_of_action | 案由标签(如"民间借贷纠纷""盗窃罪") |
| court_name | 受理法院全称 |
| full_text | 脱敏后文书全文(纯文本) |
法律题库数据集
基于真实案件提炼的法律专业知识题库,按案件复杂程度分为一般复杂、中等复杂、非常复杂三级。覆盖法律条文引用、争议焦点分析、证据链构建等核心考核维度,适用于法律职业资格考试训练、法官/律师能力评估、法律AI评测等场景。
案件事实涉及多个争议焦点或多方法当事人,需要一定程度的法律分析与事实梳理
- • 当事人2-3方
- • 争议焦点2-3个
- • 2-3部主要法律
- • 标的额≥50万元
多层次法律关系交织、多方利益冲突,需要综合适用多项法律制度
- • 当事人3-4方
- • 争议焦点3-5个
- • 3-4部主要法律
- • 标的额≥500万元
涉及重大疑难法律问题、跨领域法律规则适用,需高度专业的法律分析
- • 当事人4方以上
- • 争议焦点5个以上
- • 跨领域法律规则
- • 复杂组织主体
五级质控验收体系
从数据来源合规到最终交付确认,全流程质量保障
来源合规审查
数据来源合法性验证,确保采集/存储/传输/交付符合《网络安全法》《数据安全法》《个人信息保护法》
脱敏质量检测
隐去公司名/人名/金额等敏感信息,保持文书法律逻辑完整,脱敏合格率≥98%
内容质量核验
格式完整性/法律适用准确性/逻辑一致性/文字规范性四维查验,合格率≥99.9%
覆盖范围验收
民事50+案由/刑事50+罪名/行政10+类型全覆盖,时间范围2023-2026年
唯一性验证
文书级/pair级重复率≤0.01%,跨pair内容重复率为0,确保数据唯一性