AI-OCRとLLMの違い、実際に使ってわかった“決定的差” - CB Lab（シービー・ラボ）| “現場の困った”を解剖するメディア

結論から：
AI-OCRは「読み取る（文字起こし＋フィールド抽出）」、LLMは「解釈して再構成する（文脈判断＋正規化＋検証）」──役割が根本的に違います。現場での決定的差は、“崩れた現実”への復元力と例外処理の取り込みやすさにあります。

1. 一言でいうと

AI-OCR：画像やPDFから文字を正確に取り出す。座標とテキストの対応づけが得意。
LLM：取り出された文字列を意味で束ね直し、フォーマットを正規化し、欠落を補助推論、整合性を検算する。

例）“m2”“㎡”“平米”が混在→AI-OCRはそのまま出す、LLMは指定スキーマに合わせて「㎡」に統一＋合計値と突合。

2. まずは基礎：AI-OCRとLLMの仕事の分担

1760059900-3NpyeDqkcKhtmvwldEuBSLo9 AI-OCRとLLMの違い、実際に使ってわかった“決定的差”

3. 実務で効く「決定的差」5つ

① レイアウト崩れへの復元力

余白の但し書き、脚注、斜め撮影、表の途中改ページなど、OCR単体だと分断されがち。
LLMは見出し・周辺語から位置ではなく意味で再連結できる。

② “跨り集約”×見出し解釈

同一案件の別ページ・別資料に散らばる明細を、工種／章立てを手掛かりに一つのスキーマへ統合。

③ 単位・表記の正規化

㎡/m2/平米、t/ton、千円/円、税別/税込などの表記ゆれ・単位換算を、指定の唯一表記に揃える。
設定で「変換禁止（不明は空欄）」の安全運転も選べる。

④ 理由付き検証（検算・突合）

「内訳の合計＝表紙の合計か」「消費税計算は一致か」など、検算ルールをプロンプトに埋め込める。
不整合時は“どこでズレたか”を根拠付きで返す→監査・電帳法対応に効く。

⑤ 例外処理の学習のさせ方

OCRはテンプレ追加／領域再学習の運用が中心。
LLMは“運用ログ→ルール／用語集／RAG”への取り込みが速い。現場の判断を再現しやすい。

4. 逆にAI-OCRが勝つ場面

完全定型の帳票を大量処理（申請書、領収書の一部など）
閉域・オフラインでの単純抽出
低コストでの単項目抽出（氏名や日付だけなど）

5. ベストプラクティス：ハイブリッド構成（OCR×LLM×バリデータ）

[画像/PDF]
   │
   ▼
AI-OCR（文字・座標抽出）
   │  └→ 低信頼度領域は再スキャン/別エンジン
   ▼
LLM（意味解釈・正規化・再構成）
   │  └→ 用語集/社内適正価格DB/RAGで補助
   ▼
バリデータ（検算・突合・スキーマ検証）
   │  └→ 不整合は理由付きで差戻し
   ▼
ストレージ/メタデータ付与/CSV・API連携（Box/SharePoint等）

copy

運用の肝

出力スキーマ固定（カラム名・型・単位を先に決める）
“未確定は空欄”の原則（勝手に埋めない）
エビデンスURL/座標を保持（後から“どこを見たか”を追える）
再現性：同一入力→同一出力（乱数無効化／温度管理／ルール優先）

6. 建設・製造の具体例（3ケース）

見積書（複数社・複数ページ）統合

課題：各社フォーマット、単位ゆれ、別紙の但し書き。
解：OCRで全テキスト化→LLMが工種×細目で束ね、単位正規化、税・小計・合計を検算。差異は根拠付きで赤入れ。

注文書×型番標準化

課題：同一品の表記ゆれ（半角/全角、ハイフン、旧新型番）。
解：用語集＋RAGで正規型番に寄せ、社内適正価格DBの候補を自動提示。

竣工書類のメタデータ化

課題：膨大なPDFのタイトル・工事番号・工区などの散在。
解：OCR→LLMで表紙・脚注・台帳を横断しメタデータ抽出、Box/SharePointに自動タグ付け。

7. 品質評価のフレーム（KPIと検証設計）

KPI例

完全一致率（期待値＝出力値が完全一致）
項目網羅率（必須項目の充足割合）
単位正規化率（指定単位に統一できた割合）
検算整合率（合計・税・小計の整合）
差戻し率（人手確認が必要な案件比率）

検証設計のコツ

サンプルは最低50～100ファイル、“わざと難しいやつ”を混ぜる
合格基準を数値で先に握る（例：完全一致率85%以上、差戻し率15%以下）
誤り分類（抽出ミス／正規化ミス／検算不一致／RAGヒットせず）で改善ループを回す

8. 導入時の落とし穴と対策

落とし穴兆候対策LLMの“埋め草”それっぽい数値が入る未確定は空欄／禁止語設定／根拠必須コスト暴騰長文PDFでトークン肥大範囲抽出→要約→分割推論／キャッシュ出力揺れ同じ入力で微差温度低／決定論的ルール優先／スキーマ検証ガバナンス誰がいつ何を監査ログ（入力/出力/プロンプト/根拠）保持現場不信“黒箱”感根拠リンク・スクリーンショット座標返却

9. まとめ

AI-OCRは入口、LLMは出口を整えるエンジン。
決定的差は**“崩れた現実”を意味で復元**し、例外を運用ログに取り込んで精度を上げ続けられる点。
最短距離はハイブリッド：OCRで取り込み、LLMで解釈・正規化、最後に検算・スキーマ検証で再現性を担保する。

10. 付録A：導入検討チェックリスト

帳票の必須スキーマ（カラム名・型・単位）が定義済み
単位換算ルールと変換禁止リストがある
検算ルール（税、合計、端数処理）が文章化されている
用語集／品番正規化表／社内適正価格DBの初期版がある
監査ログの保管場所と保管年限を決めた
合格基準KPIとサンプルセットが準備できた

11. 付録B：出力安定化プロンプトの型（例）

【唯一絶対ルール】
- 指定スキーマ以外の項目は出力しない
- 不明・未記載は推測せず空欄
- 数値は半角、単位は「㎡/m/円/円(税抜)/円(税込)」に統一
- 出力はUTF-8のJSON、キー名は以下に固定

【スキーマ】
{ 
  "工種": "", "細目番号": "", "品名": "",
  "数量": "", "単位": "㎡|m|式|…", 
  "単価_税抜": "", "金額_税抜": "", 
  "備考": ""
}

【検算ルール】
- Σ(金額_税抜) = 表紙の小計 ±1円まで許容
- 税計算は端数切り上げ
- 不一致時は "errors":[{原因, 該当行}] を返す

【根拠返却】
- 各行に "evidence": {page, x1,y1,x2,y2, text} を付与

編集後記（運用Tips）

“まずは10ファイルで共通ルール化”→50ファイルでKPI計測→100ファイルで例外吸収の三段ロケット。
“現場の判断”はテキストで書き出し、ルール／用語集／RAGに落とすと精度が伸びます。

Connected Baseのご紹介

「AI-OCR」「RPA」から
“LLM＋人の判断”の再現へと移りつつあります。

Connected Base は、日々の見積書・請求書・報告書など、
人の判断を必要とする“あいまいな領域”を自動で処理し、
現場ごとのルールや判断のクセを学習していくAIプラットフォームです。

これまで人が時間をかけて行ってきた仕分けや確認を、
AIとルール設定だけで再現・蓄積・自動化。
単なる効率化ではなく、「判断の継承」まで含めたDXを実現します。

現場の知恵を未来につなぐ──
その第一歩を、Connected Baseとともに。

👉 https://connected-base.jp/