Docling 解析器

Docling 是 IBM 开源的文档处理引擎，专为企业级文档解析设计。它支持 PDF、Word、PPT、HTML 等多种格式，擅长处理复杂的版面布局、表格、公式等元素。CatWiki 已无缝集成 Docling 作为核心解析后端之一。

IMPORTANT

当前验证版本：docling-serve v1.12.0 CatWiki 当前已在 docling-serve v1.12.0 上完成集成测试，推荐部署此版本。 Docker 镜像：ghcr.io/docling-project/docling-serve-cu126:v1.12.0

环境要求

在部署 Docling 之前，请确保您的设备满足以下条件：

硬件：包含 NVIDIA 显卡（如 RTX 30/40 系列），显存建议 > 8G（用于 OCR 和大文件处理）。
驱动：NVIDIA 显卡驱动版本建议 > 550.54.14，且已安装 NVIDIA Container Toolkit。
软件：已安装 Docker 和 Docker Compose。

部署服务

Docker Compose 部署 (推荐)

使用官方 CUDA 12.6 镜像可获得极致性能。以下配置利用 Docling 的原生机制实现全自动模型下载，无需任何初始化脚本。

创建 docker-compose.yml：

yaml

services:
  docling-serve:
    image: ghcr.io/docling-project/docling-serve-cu126:v1.12.0
    container_name: docling-serve
    ports:
      - "8002:5001"
    environment:
      # 1. 指定 HuggingFace 国内镜像源，加速下载
      HF_ENDPOINT: "https://hf-mirror.com"
      DOCLING_SERVE_ENABLE_UI: "true"
      NVIDIA_VISIBLE_DEVICES: "0"
      DOCLING_SERVE_API_KEY: "4GiLk4WPeh"
      DOCLING_NUM_THREADS: "50"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              device_ids: ["0"]
              capabilities: [ gpu ]
    restart: always

启动服务

bash

docker compose up -d

启动完成后，访问 http://<server-ip>:8002/docs 可进入 Swagger 交互式文档界面。

CatWiki 集成配置

部署完成后，在 CatWiki 管理后台进行如下配置：

进入设置 → 文档解析
点击 添加解析器
填写配置：
- 名称：Docling (可自定义)
- 类型：选择 Docling
- API 端点：http://<docling-ip>:8002 (docker-compose 映射端口)
点击 测试连接。
启用并保存。

适用场景

Docling 特别适合以下场景：

🏢 企业文档：批量处理报告、技术说明书等。
📊 结构化提取：精准提取 PDF 中的多行复杂表格。
🖼️ 图文混排：支持提取文档图片并生成公开链接，供 AI 直接引用。
⚖️ 轻量级需求：相比 MinerU，Docling 对资源的需求相对可控。

常见问题

Q: GPU 加速没有生效？

请检查 Docker 运行时（Runtime）是否已正确配置。可通过 docker info | grep -i runtime 确认是否包含 nvidia。如果未配置，请参考 NVIDIA 容器工具安装说明。

Q: 解析超大 PDF 时内存溢出 (OOM)？

Docling 在处理数百页的复杂 PDF 时会消耗较多显存/内存。建议：

增加宿主机的 Swap 空间或容器内存限制。
将超长文档切分后再上传。

Docling 解析器 ​

环境要求 ​

部署服务 ​

Docker Compose 部署 (推荐) ​

启动服务 ​

CatWiki 集成配置 ​

适用场景 ​

常见问题 ​

Q: GPU 加速没有生效？ ​

Q: 解析超大 PDF 时内存溢出 (OOM)？ ​

相关链接 ​