SrP-Skills技能剪报 · 来源索引

社区收录 技能

book-to-skill

把技术书籍、文档夹或资料集合提炼成符合 Agent Skills 标准的可按需加载 skill,支持 PDF/EPUB/DOCX/HTML/RTF/MOBI 等格式,生成结构化 SKILL.md、章节文件、词汇表与速查表,相比直接塞入上下文可节省 24×–51× token。

社区收录技能包skill-generatorbookspdfepubknowledge-extractionagent-skills

book-to-skill

book-to-skill 是一个 skill 生成器:把任意技术书籍、文档夹或资料集合提炼成一个符合开源 Agent Skills 标准的 skill,供 GitHub Copilot CLI、Amp 或 Claude Code 按需加载、参考和使用。它本身输出的就是一个 skill,但作为收录对象而言它是一个「面向 skill 的转换工具」,与 NVIDIA SkillSpector 这类 skill 周边工具同属一类。

核心理念是一次性在编译期支付「导航成本」:抽取作者构建的框架、命名、决策规则和反模式并写入结构化文件;运行时仅加载约 4K token 的核心 SKILL.md 加上你问到的那一章(约 1K token),相比把整本书塞进上下文或让 agent 反复翻页检索可节省 24×–51× token。

来源

适合什么时候用

  • 买来只用过一次就忘的技术书,希望变成可按章节查询、写代码时能调用的 skill。
  • 把内部文档(架构决策记录、runbook、onboarding 指南)或品牌设计规范折叠成团队共用并可持续更新的知识包。
  • 把一组论文加个人笔记合并成一个统一的研究 skill,新资料到达后以 fold-in 模式追加而不重建。
  • 处理 RFC、API 契约、合规文档这类长文档,转化为按需加载的章节文件而不是每次对话都占满上下文窗口。

生成内容

/book-to-skill your-book.pdf(单个文件、文件夹、glob 或路径列表)会在 agent 的 skills 目录生成完整 skill:

文件作用大小
SKILL.md核心心智模型 + 章节索引~4,000 token
chapters/ch01-*.md每章一个文件,按需加载~1,000 token/章
glossary.md全部关键术语,按字母排序并标注章节引用~1,500 token
patterns.md所有技术、算法与设计模式~2,000 token
cheatsheet.md决策表与速查规则~1,000 token

章节文件按需加载,未问到的章节不计入 skill 预算。

支持格式

PDF、EPUB、DOCX、TXT、Markdown、reStructuredText、AsciiDoc、HTML、RTF、MOBI/AZW/AZW3。PDF 按书籍类型选抽取器:文本类用 pdftotext(即时),技术类(含表格、公式、代码)用 docling(约 1.5s/页,保留 Markdown 表格和代码块)。运行前会询问书籍类型并自动选择工具。

使用方式

book-to-skill 作为 agent skill 使用时,安装到任意兼容 Agent Skills 标准的宿主即可:

# Claude Code
git clone https://github.com/virgiliojr94/book-to-skill.git ~/.claude/skills/book-to-skill

# GitHub Copilot CLI / Amp(跨 agent 路径)
git clone https://github.com/virgiliojr94/book-to-skill.git ~/.agents/skills/book-to-skill

安装后在 agent 会话中:

/book-to-skill ~/path/to/your-book.pdf
# 或文件夹 / glob / 多个路径
/book-to-skill ~/books/*.epub my-library

# 生成后像普通 skill 一样使用
/designing-data-intensive-apps replication      # 查找并解释某主题
/designing-data-intensive-apps ch05            # 深入第 5 章

也可作为独立 CLI 仅安装抽取引擎(不注册 agent skill):pip install "book-to-skill[pdf,epub,docx]",然后 book-to-skill ~/path/to/book.pdf --mode text

使用注意

  1. 抽取与分析在本地运行,工具本身不会上传你的文件;但喂给 agent 的文本会遵循对应模型供应商的数据条款。
  2. 章节自动检测需要明确的 Chapter N / Capítulo N 标题;仅靠章节标题或罗马数字(以及未用 ebooklib 抽取的 EPUB)可能无法自动分段,但抽取与转换仍可工作,需手动指定章节。
  3. 生成的 skill 是结构化合成笔记(框架名、定义、要点),不是原文复制,且明确禁止复制原始段落——以自己的私有笔记对待受版权保护的第三方书籍。
  4. 安装、抽取器依赖和模型能力以上游仓库为准。