
说明:本文分享一个从实际项目中抽离的演示项目(Demo),清晰展示如何结合 OCR、大模型与 Web 技术实现单据解析的基本流程。项目代码结构清晰、易于理解,适合初学者学习参考。实际生产环境则需补充更完善的错误处理、性能优化与安全机制。1. 项目概述单据智能解析 Agent是一个基于 Python Flask 后端和 Vue.js 前端的自动化票据处理系统。该系统能够智能识别和解析四种常见业务单据(报销单、采购单、报修单、合同)以及增值税发票,自动提取关键字段并分类保存到 Excel 台账中。核心功能多格式支持:支持 PNG、JPG、JPEG、BMP 图片和 TXT 文本文件智能分类:自动区分普通单据与发票,采用不同的解析策略OCR 识别:集成 RapidOCR 引擎,准确提取图片中的文字信息结构化提取:使用 LangChain + DeepSeek 大模型精准提取关键字段数据归档:自动分类保存到对应的 Excel 台账文件RESTful API:提供标准化的文件上传和解析接口2. 系统架构2.1 技术栈后端技术栈:Web 框架:Flask(轻量级 Python Web 框架)OCR 引擎:RapidOCR-ONNXRuntime(高性能文字识别)大模型接口:LangChain + DeepSeek API数据解析:Pydantic(结构化数据验证)表格处理:OpenPyXL(Excel 文件操作)跨域支持:Flask-CORS前端技术栈:框架:Vue 3 + Composition APIUI 组件库:Element PlusHTTP 客户端:Axios构建工具:Vite2.2 系统流程图