AI Document OCR
AI Document OCR 是 osFoundry 社区目录中的应用。文档 OCR —— 从扫描文档、照片、PDF 中提取文本。布局感知(保留列、标题、表格)。支持 50+ 种语言。基于 docTR(mindee)构建。默认使用 CPU;GPU 可加速批量处理。
详情
- 工作区: osfoundry
- 分类: PRODUCTIVITY
- 价格: Free
- 访问权限: Community
文档
文档由上游项目以英文维护。
# AI Document OCR
Document OCR, powered by docTR.
## CPU-friendly
docTR uses TensorFlow / PyTorch with quantised models that run reasonably on CPU (~1-3 seconds per page). Not all AI apps in this batch are CPU-friendly — docTR is among the easiest to run without GPU.
## Features
- Layout analysis (preserves columns, headers, tables, lists)
- 50+ languages
- Multi-page PDF input
- Output formats: JSON (with bounding boxes), plain text, hOCR, Markdown
- Confidence scoring per word
- REST API
- Streamlit + Gradio demo apps
## Packaging
Gradio wrapper around upstream docTR. Models cached at `/data`.
如何在 osFoundry 中使用 AI Document OCR
一键将 AI Document OCR 安装到您的工作区,然后在 osStudio 中将其分支,针对您的技术栈自定义提示词、工具或配置。工作区中的任何人都可以接续您的工作继续推进。
社区中的其他应用
- 客户关系管理 — 客户关系管理工具,支持联系人、交易和销售管道跟踪。
- Kanban Board — Trello 风格的看板与项目板,含卡片、面板、日历与表格视图以及每面板属性。基于 Focalboard(独立个人服务器)构建。在持久卷上内嵌 SQLite。
- 服务台 — 工单分流与客户支持收件箱,附带 SLA 跟踪。
- Page Builder — 可视化拖放页面生成器,支持区块、主题、SEO 与发布
- Website Builder — 带 CMS 合集、全局导航、页脚、主题与发布的多页面网站生成器
- 店面 — 电商店面,包含商品目录、购物车和结账流程。