酷特喵
酷特喵

Papermerge

开源可自托管的OCR文档管理系统

1 浏览
2026年5月27日

Papermerge介绍

Papermerge是一款开源、可自托管的文档管理系统(DMS),专为数字化归档扫描文件而设计,支持PDF、JPEG和TIFF等格式。它内置强大的OCR功能(基于Tesseract引擎),能识别超100种语言,让所有扫描文档实现全文可搜索;同时提供版本控制、自定义元数据、灵活的分类标签、页面级编辑(如旋转、拆分、重排)以及现代化Web界面,兼顾专业性与易用性,是个人、自由职业者、中小企业及法律、学术领域构建安全、私密、无纸化数字档案的理想选择。

Papermerge网站截图

Papermerge

Papermerge的主要功能

  • 支持PDF/JPEG/TIFF等多格式文档上传
  • 内置Tesseract OCR,支持100+语言全文识别
  • 自动文档版本控制,保留原始文件与处理记录
  • 支持自定义元数据字段(如发票号、客户名等)
  • 提供文件夹+类别+标签三维组织体系
  • 网页端直接进行页面旋转、删除、提取等操作

Papermerge如何使用

  1. 1通过Docker或源码在自有服务器上完成自托管部署
  2. 2登录Web界面后批量上传扫描件或PDF文件
  3. 3系统自动排队执行OCR并嵌入可搜索文本层
  4. 4为文档添加分类(如“合同”“收据”)、标签及自定义元数据
  5. 5使用全局搜索框按内容、标题、标签或元数据快速定位文档

Papermerge的应用场景

  • 个人家庭账单、税务资料与证件的长期数字归档
  • 小型企业统一管理发票、采购单与客户协议
  • 法律从业者归档案件材料并追踪文档修改历史
  • 研究人员整理扫描论文、笔记与参考文献
  • 行政/档案部门构建内部可审计、可追溯的电子档案库

评论

暂无评论,来发表第一条评论吧!

发表评论