SrP-Skillsskill gazette & source index

community skill

MinerU Document Extractor

OpenDataLab MinerU-Ecosystem 的文档提取 skill,通过 mineru-open-api 将 PDF、扫描件、图片、Office 文档和网页转换为 Markdown、HTML、LaTeX、DOCX 或 JSON。

communityskill packagedocument-extractionocrpdfmarkdownmineru

MinerU Document Extractor

MinerU Document Extractor 是 OpenDataLab MinerU-Ecosystem 中面向 AI agent 的文档提取 skill。它通过 mineru-open-api CLI 将 PDF、扫描件、图片、Word、PowerPoint、Excel 和网页内容转换为 Markdown、HTML、LaTeX、DOCX 或 JSON,适合处理表格、公式、OCR 和复杂版式文档。

来源

适合什么时候用

  • 需要把 PDF、扫描件或图片 OCR 成适合 LLM 继续处理的 Markdown。
  • 需要从学术论文、技术报告或复杂版式文档中提取表格、公式和阅读顺序。
  • 需要把 Word、PPT、Excel 或远程文件批量转换成 Markdown、HTML、LaTeX、DOCX 或 JSON。
  • 需要让 agent 调用命令行工具处理网页抓取和文档解析,而不是手工复制粘贴内容。

核心模式

MinerU skill 主要引导 agent 在两种提取模式中选择:

模式是否需要 token输出典型用途
flash-extractMarkdown小文件快速解析,适合 10 MB / 20 页以内的文档预览
extractMarkdown、HTML、LaTeX、DOCX、JSON高精度、多格式、批量处理和复杂版式解析

CLI 还提供 crawl 用于网页内容转 Markdown,但需要 MinerU token。

安装提示

这是社区上游的单目录 skill,本站只收录索引和中文说明,不镜像上游 SKILL.md。站点详情页生成的安装命令会指向上游 skill 目录:

npx skills add https://github.com/opendatalab/MinerU-Ecosystem/tree/main/skills

实际运行文档解析还需要安装 mineru-open-api CLI。上游 skill 给出的 npm 安装方式为:

npm install -g mineru-open-api
mineru-open-api version

需要使用 extractcrawl 时,还要在 https://mineru.net/apiManage/token 创建 token 后运行:

mineru-open-api auth

也可以通过 MINERU_TOKEN 环境变量提供 token。

使用注意

  1. flash-extract 不需要登录,但受 10 MB / 20 页和速率限制约束。
  2. extract 支持更高限制、批量和多格式输出,但需要 token。
  3. 文档内容会发送到 MinerU API 进行服务端解析;处理敏感文件前应确认用户接受该数据流。
  4. 安装、命令参数和模型能力以 OpenDataLab 上游仓库为准。