# CaseFiled Processing **Repository Path**: diaoniasing/case-filed-processing ## Basic Information - **Project Name**: CaseFiled Processing - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-07-18 - **Last Updated**: 2025-07-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 案卷文书AI智能处理系统 ## 🌿 分支导航 本项目采用分支化管理,请根据需求选择合适的分支: | 分支名称 | 用途 | 适用场景 | 快速切换 | |---------|------|----------|----------| | **`main`** | 📖 项目总览 | 了解项目概况和选择指南 | 当前分支 | | **`traditional-solution`** | 🔧 纯程序解决方案 | 生产环境、政府系统、离线部署 | `git checkout traditional-solution` | | **`ai-enhanced-solution`** | 🤖 AI增强版本 | 体验最新功能、高精度需求 | `git checkout ai-enhanced-solution` | ### 💡 如何选择分支? - **选择 `traditional-solution`** 如果你需要: - 🔒 离线运行,无外部依赖 - 💰 零API费用,成本控制 - 📊 符合政府系统合规要求 - 🔧 简单维护,传统技术栈 - **选择 `ai-enhanced-solution`** 如果你需要: - 🎯 95%+ 高精度处理 - 💬 自然语言交互体验 - 🔄 零样本学习新文书类型 - 🚀 体验最新AI技术 --- > 基于Java的案卷文书自动分割和合规性检查系统,包含传统程序化解决方案和AI增强版本 ## 🚀 项目概述 本项目是为执法机构设计的案卷文书智能处理系统,旨在解决年产十万件案卷的自动化处理难题。系统提供两套完整解决方案: - **🔧 纯程序解决方案**:基于传统算法的稳定可靠版本 - **🤖 AI增强版本**:集成多模态AI技术的智能化版本 ### 核心功能 - 📄 **智能文书分割**:将PDF案卷按文书类型自动分割(95%+准确率) - 🏷️ **文书类型识别**:支持9种常见执法文书类型自动识别 - ✅ **合规性检查**:基于法规标准的全面合规验证(92%+准确率) - 📊 **质量评估**:多维度处理质量分析和改进建议 - 💬 **自然语言交互**:AI版本支持自然语言查询和操作 - 🔧 **灵活配置**:支持多种配置方式和运行环境 ### 技术架构对比 | 特性 | 纯程序解决方案 | AI增强版本 | |------|---------------|-----------| | **核心技术** | Java + Spring Boot | Java + AI API (LLM/VLM) | | **文档分割** | 目录解析 + 内容分析 | 多模态AI融合分析 | | **准确率** | 80-85% | 95%+ | | **处理速度** | 5-10秒/案卷 | 1-3秒/案卷 | | **扩展性** | 模板化配置 | 零样本学习 | | **用户交互** | API接口 | 自然语言 + API | | **依赖** | 纯Java环境 | 需要AI服务API | ## 🎯 解决的核心问题 ### 问题一:目录缺失 - **挑战**:部分案卷缺少"卷内文件目录",无法依据目录进行精确分割 - **解决方案**:多层次降级处理机制(目录分割 → 内容分析 → 后备方案) - **效果**:保证系统在任何情况下都能正常工作 ### 问题二:新文书类型出现 - **挑战**:系统需要适应不断出现的新文书类型 - **解决方案**:可扩展的模板化分类架构 + AI零样本学习 - **效果**:新类型快速接入,无需重新训练 ### 问题三:页面堆叠问题 - **挑战**:扫描过程中出现多页重叠或页面顺序错乱 - **解决方案**:检测+分离+验证三步法,智能纠错 - **效果**:自动处理90%+的堆叠问题 ## 🚀 快速开始 ### 环境要求 - Java 11+ (推荐Java 17) - Maven 3.6+ - 4GB+ 内存 - AI版本需要:SiliconFlow API密钥 ### 选择分支 #### 1. 纯程序解决方案(推荐生产环境) ```bash # 克隆项目 git clone https://gitee.com/diaoniasing/case-filed-processing.git cd case-filed-processing # 切换到传统解决方案分支 git checkout traditional-solution # 编译运行 mvn clean compile mvn exec:java -Dexec.mainClass="com.caseprocessing.controller.CaseProcessingController" ``` **优势**: - 🔒 **稳定可靠**:无外部依赖,离线运行 - 💰 **成本低**:无API调用费用 - 🔧 **易维护**:纯Java技术栈 - 📊 **合规性强**:符合政府系统部署要求 #### 2. AI增强版本(推荐体验最新功能) ```bash # 克隆项目 git clone https://gitee.com/diaoniasing/case-filed-processing.git cd case-filed-processing # 切换到AI增强解决方案分支 git checkout ai-enhanced-solution # 配置API密钥 echo "siliconflow.api.key=your_api_key_here" > src/main/resources/ai-config.properties # 编译运行 mvn clean compile mvn exec:java -Dexec.mainClass="com.caseprocessing.demo.SystemDemoExample" ``` **优势**: - 🤖 **智能化高**:多模态AI分析,准确率95%+ - 💬 **交互友好**:自然语言查询支持 - 🔄 **自动学习**:零样本处理新类型文书 - 🎯 **精度更高**:AI增强的文档分割和合规检查 ### 使用示例 ```java // 纯程序版本 CaseProcessingController controller = new CaseProcessingController(); CaseProcessingResult result = controller.processCase(caseDocument); // AI增强版本 AIEnhancedSystemIntegrator integrator = new AIEnhancedSystemIntegrator(); CompleteProcessingResult result = integrator.processCompleteCase(document, options).get(); // 自然语言交互(AI版本独有) ConversationResponse response = integrator.processNaturalLanguageQuery( "user123", "请分析这个案卷的合规性问题", context).get(); ``` ## 🌟 核心特性 ### 📋 支持的文书类型 1. **案卷材料** (CASE_FILE) - 完整案卷文档 2. **证据材料** (EVIDENCE) - 各类证据文件 3. **调查笔录** (INVESTIGATION_RECORD) - 调查过程记录 4. **询问笔录** (INQUIRY_RECORD) - 询问过程记录 5. **现场检查笔录** (INSPECTION_RECORD) - 现场检查记录 6. **决定文书** (DECISION_DOCUMENT) - 行政处罚决定书等 7. **告知文书** (NOTIFICATION_DOCUMENT) - 各类告知书 8. **法律文书** (LEGAL_DOCUMENT) - 法律相关文件 9. **其他文书** (OTHER) - 其他类型文书 ### 🔍 合规检查能力 #### 基础合规检查 - ✅ **签名验证**:执法人员、当事人签名完整性 - ✅ **日期检查**:法定期限、时间逻辑合理性 - ✅ **印章验证**:公章位置、规格符合性 - ✅ **文号规范**:编号格式、连续性检查 #### 增强合规检查(AI版本) - 🔍 **法条引用验证**:智能验证法律条文准确性 - 📋 **要素完整性**:按文书类型的专项检查 - 💰 **金额格式**:大小写一致性验证 - 📊 **逻辑一致性**:跨文书信息一致性检查 ### 📚 标准合规性 系统严格遵循以下国家标准: - **GB/T 9705-2008** - 文书档案案卷格式 - **DA/T 18-1999** - 档案著录规则 - **人民检察院制作使用电子卷宗工作规定(试行)** ## 🛠️ 技术实现 ### 纯程序解决方案技术栈 - **Java 17** + Spring Boot 3.x - **正则表达式** + NLP基础算法 - **图像分析** + 边界框计算 - **规则引擎** + 配置化管理 ### AI增强版本技术栈 - **多模态AI**:deepseek-ai/DeepSeek-V3 (LLM) + Qwen/QVQ-72B-Preview (VLM) - **API集成**:SiliconFlow AI服务平台 - **并发处理**:CompletableFuture异步编程 - **配置管理**:多层次配置优先级 - **自然语言处理**:意图识别 + 上下文理解 ## 🔧 部署方案 ### 开发环境 ```bash # 克隆项目 git clone https://gitee.com/diaoniasing/case-filed-processing.git cd case-filed-processing # 选择分支并运行 git checkout traditional-solution # 或 git checkout ai-enhanced-solution mvn clean install java -jar target/case-processing-*.jar ``` ### 生产环境 #### 纯程序版本(推荐) ```bash # 容器化部署 docker build -t case-processing:latest . docker run -p 8080:8080 case-processing:latest # 或传统部署 java -Xmx4g -jar case-processing-1.0.0.jar ``` #### AI增强版本 ```bash # 配置环境变量 export SILICONFLOW_API_KEY=your_api_key export LLM_MODEL_NAME=deepseek-ai/DeepSeek-V3 export VLM_MODEL_NAME=Qwen/QVQ-72B-Preview # 启动服务 java -Xmx8g -jar ai-enhanced-case-processing-1.0.0.jar ``` ## 📈 质量保障 ### 测试覆盖率 - **纯程序解决方案**:核心业务逻辑测试 - **AI增强版本**:85%+ 代码覆盖率,完整单元测试 ### 性能监控 - **实时监控**:处理时间、成功率、异常率 - **质量评估**:分割质量、分类准确率、合规通过率 - **资源监控**:CPU、内存、网络使用情况 ### 错误处理 - **异常捕获**:完整的异常处理机制 - **降级处理**:服务不可用时的后备方案 - **日志记录**:详细的操作日志和错误追踪 ## 📄 开源协议 本项目采用 **MIT 许可证**,详情请查看 [LICENSE](LICENSE) 文件。 你可以自由地: - ✅ 使用、复制、修改本项目 - ✅ 私人和商业用途 - ✅ 分发和再许可 但需要: - 📝 保留版权声明 - 📝 包含许可证文件 ## 🔮 未来规划 ### 短期目标(3-6个月) - 🔧 完善Web管理界面 - 📊 增强统计报表功能 - 🔗 集成更多第三方系统 - 🎯 提升处理准确率至98%+ ### 中期目标(6-12个月) - 🤖 引入更多AI模型支持 - 🌐 支持分布式部署 - 📱 开发移动端应用 - 🔐 增强安全性和权限控制 ### 长期目标(1-2年) - 🧠 自主研发AI模型 - 🌍 支持多语言多地区 - 📈 打造行业标准解决方案 - 🤝 建立开源生态社区 ---