PYTHON+AI LLM DAY EIGHTY-EIGHT

发布时间:2026/6/27 3:24:58

PYTHON+AI LLM DAY EIGHTY-EIGHT 今天聊聊一些文档加载器(Loaders)的工具.这些工具利用OCR技术可以实现对不同文档格式(PDF,DOCX,PPTX,Images等)中的图片识别和一些文字的提取.它们大都基于langchain框架.继承BaseLoader,实现lazy_load方法按需生成Document对象.对于PDF文档,先是定义一个PDF加载器,然后用这个加载器继承BaseLoader.from langchain_core.document_loaders import BaseLoader.然后继承父类BaseLoader,class PDFloader(BaseLoader).然后定义__init__()方法和lazy_load()方法.最后定义pdf转文本的方法获取里面的文字和图片.对于word,ppt,images等格式的文件的处理方法一致.最后再说一下对于统计图表等的处理.例如最新版的PaddleOCR-vl-1.6模型.地址为:https://aistudio.baidu.com/paddleocr.先是将一般文档传入模型,返回json或markdown格式,再交由多模态模型处理,提取里面要用到的信息.

相关新闻