community skill

MinerU Document Extractor

OpenDataLab MinerU-Ecosystem 的文档提取 skill，通过 mineru-open-api 将 PDF、扫描件、图片、Office 文档和网页转换为 Markdown、HTML、LaTeX、DOCX 或 JSON。

communityskill packagedocument-extractionocrpdfmarkdownmineru

ID: community/mineru-document-extractor
Source: community
Updated: 2026-05-06
Upstream: https://github.com/opendatalab/MinerU-Ecosystem/tree/main/skills
License: Apache-2.0

Use cases

把 PDF、扫描件或图片 OCR 成适合 LLM 继续处理的 Markdown
从学术论文、技术报告或复杂版式文档中提取表格、公式和阅读顺序
批量转换 Word、PPT、Excel 或远程文件为 Markdown、HTML、LaTeX、DOCX 或 JSON
让 AI agent 通过命令行调用 MinerU Open API 处理网页抓取和文档解析

One-command upstream install

Copy the command and run it in the target project directory to install this community skill from its upstream URL.

Requires a local Node.js / npm environment; npx invokes the skills CLI temporarily and installs to the current project by default.

Install from upstreamnpx skills add https://github.com/opendatalab/MinerU-Ecosystem/tree/main/skills

MinerU Document Extractor

MinerU Document Extractor 是 OpenDataLab MinerU-Ecosystem 中面向 AI agent 的文档提取 skill。它通过 mineru-open-api CLI 将 PDF、扫描件、图片、Word、PowerPoint、Excel 和网页内容转换为 Markdown、HTML、LaTeX、DOCX 或 JSON，适合处理表格、公式、OCR 和复杂版式文档。

来源

上游 skill 目录：https://github.com/opendatalab/MinerU-Ecosystem/tree/main/skills
上游 SKILL.md：https://github.com/opendatalab/MinerU-Ecosystem/blob/main/skills/SKILL.md
CLI 参考：https://github.com/opendatalab/MinerU-Ecosystem/tree/main/cli/mineru-open-api
许可证：Apache-2.0

适合什么时候用

需要把 PDF、扫描件或图片 OCR 成适合 LLM 继续处理的 Markdown。
需要从学术论文、技术报告或复杂版式文档中提取表格、公式和阅读顺序。
需要把 Word、PPT、Excel 或远程文件批量转换成 Markdown、HTML、LaTeX、DOCX 或 JSON。
需要让 agent 调用命令行工具处理网页抓取和文档解析，而不是手工复制粘贴内容。

核心模式

MinerU skill 主要引导 agent 在两种提取模式中选择：

模式	是否需要 token	输出	典型用途
`flash-extract`	否	Markdown	小文件快速解析，适合 10 MB / 20 页以内的文档预览
`extract`	是	Markdown、HTML、LaTeX、DOCX、JSON	高精度、多格式、批量处理和复杂版式解析

CLI 还提供 crawl 用于网页内容转 Markdown，但需要 MinerU token。

安装提示

这是社区上游的单目录 skill，本站只收录索引和中文说明，不镜像上游 SKILL.md。站点详情页生成的安装命令会指向上游 skill 目录：

npx skills add https://github.com/opendatalab/MinerU-Ecosystem/tree/main/skills

实际运行文档解析还需要安装 mineru-open-api CLI。上游 skill 给出的 npm 安装方式为：

npm install -g mineru-open-api
mineru-open-api version

需要使用 extract 或 crawl 时，还要在 https://mineru.net/apiManage/token 创建 token 后运行：

mineru-open-api auth

也可以通过 MINERU_TOKEN 环境变量提供 token。

使用注意

flash-extract 不需要登录，但受 10 MB / 20 页和速率限制约束。
extract 支持更高限制、批量和多格式输出，但需要 token。
文档内容会发送到 MinerU API 进行服务端解析；处理敏感文件前应确认用户接受该数据流。
安装、命令参数和模型能力以 OpenDataLab 上游仓库为准。