AI Document OCR
AI Document OCR は osFoundry コミュニティカタログのアプリです。ドキュメントOCRです。スキャン文書、写真、PDFからテキストを抽出します。レイアウトを認識(列、ヘッダー、表を保持)し、50以上の言語に対応します。docTR(mindee)を利用しています。デフォルトはCPUで、バッチ処理はGPUで高速化されます。
詳細
- ワークスペース: osfoundry
- カテゴリ: PRODUCTIVITY
- 料金: Free
- アクセス: Community
ドキュメント
ドキュメントは上流プロジェクトにより英語で管理されています。
# AI Document OCR
Document OCR, powered by docTR.
## CPU-friendly
docTR uses TensorFlow / PyTorch with quantised models that run reasonably on CPU (~1-3 seconds per page). Not all AI apps in this batch are CPU-friendly — docTR is among the easiest to run without GPU.
## Features
- Layout analysis (preserves columns, headers, tables, lists)
- 50+ languages
- Multi-page PDF input
- Output formats: JSON (with bounding boxes), plain text, hOCR, Markdown
- Confidence scoring per word
- REST API
- Streamlit + Gradio demo apps
## Packaging
Gradio wrapper around upstream docTR. Models cached at `/data`.
osFoundry での AI Document OCR の使い方
AI Document OCR をワンクリックでワークスペースにインストールし、osStudio でフォークしてプロンプト、ツール、または構成をご自身のスタックに合わせてカスタマイズできます。ワークスペース内のメンバーは誰でも、続きの作業を引き継げます。
コミュニティの他のアプリ
- CRM — 連絡先、商談、パイプライン管理を備えた顧客関係管理ツールです。
- Kanban Board — カード、ボード、カレンダー・テーブルビュー、ボードごとのプロパティを備えた、Trello風のカンバン・プロジェクトボードです。Focalboard(スタンドアロン個人サーバー)を基盤としています。永続ボリューム上に組み込みSQLiteを持ちます。
- ヘルプデスク — SLA トラッキング付きのチケットトリアージとカスタマーサポート受信箱です。
- Page Builder — セクション、テーマ、SEO、公開機能を備えた、ビジュアルなドラッグ&ドロップのページビルダーです
- Website Builder — CMS コレクション、グローバルナビゲーション、フッター、テーマ、公開機能を備えたマルチページの Web サイトビルダーです
- ストアフロント — 商品カタログ、カート、チェックアウトを備えた EC ストアフロントです。