社区收录 技能
MinerU Document Extractor
OpenDataLab MinerU-Ecosystem 的文档提取 skill,通过 mineru-open-api 将 PDF、扫描件、图片、Office 文档和网页转换为 Markdown、HTML、LaTeX、DOCX 或 JSON。
社区收录技能包document-extractionocrpdfmarkdownmineru
MinerU Document Extractor
MinerU Document Extractor 是 OpenDataLab MinerU-Ecosystem 中面向 AI agent 的文档提取 skill。它通过 mineru-open-api CLI 将 PDF、扫描件、图片、Word、PowerPoint、Excel 和网页内容转换为 Markdown、HTML、LaTeX、DOCX 或 JSON,适合处理表格、公式、OCR 和复杂版式文档。
来源
- 上游 skill 目录:https://github.com/opendatalab/MinerU-Ecosystem/tree/main/skills
- 上游 SKILL.md:https://github.com/opendatalab/MinerU-Ecosystem/blob/main/skills/SKILL.md
- CLI 参考:https://github.com/opendatalab/MinerU-Ecosystem/tree/main/cli/mineru-open-api
- 许可证:Apache-2.0
适合什么时候用
- 需要把 PDF、扫描件或图片 OCR 成适合 LLM 继续处理的 Markdown。
- 需要从学术论文、技术报告或复杂版式文档中提取表格、公式和阅读顺序。
- 需要把 Word、PPT、Excel 或远程文件批量转换成 Markdown、HTML、LaTeX、DOCX 或 JSON。
- 需要让 agent 调用命令行工具处理网页抓取和文档解析,而不是手工复制粘贴内容。
核心模式
MinerU skill 主要引导 agent 在两种提取模式中选择:
| 模式 | 是否需要 token | 输出 | 典型用途 |
|---|---|---|---|
flash-extract | 否 | Markdown | 小文件快速解析,适合 10 MB / 20 页以内的文档预览 |
extract | 是 | Markdown、HTML、LaTeX、DOCX、JSON | 高精度、多格式、批量处理和复杂版式解析 |
CLI 还提供 crawl 用于网页内容转 Markdown,但需要 MinerU token。
安装提示
这是社区上游的单目录 skill,本站只收录索引和中文说明,不镜像上游 SKILL.md。站点详情页生成的安装命令会指向上游 skill 目录:
npx skills add https://github.com/opendatalab/MinerU-Ecosystem/tree/main/skills
实际运行文档解析还需要安装 mineru-open-api CLI。上游 skill 给出的 npm 安装方式为:
npm install -g mineru-open-api
mineru-open-api version
需要使用 extract 或 crawl 时,还要在 https://mineru.net/apiManage/token 创建 token 后运行:
mineru-open-api auth
也可以通过 MINERU_TOKEN 环境变量提供 token。
使用注意
flash-extract不需要登录,但受 10 MB / 20 页和速率限制约束。extract支持更高限制、批量和多格式输出,但需要 token。- 文档内容会发送到 MinerU API 进行服务端解析;处理敏感文件前应确认用户接受该数据流。
- 安装、命令参数和模型能力以 OpenDataLab 上游仓库为准。