Codex / Claude Skills 生态观察
下面按入口、方法论仓库、索引、代码库打包、信息订阅、桌面补丁、会话维护、中文项目和领域专用技能几层往下看。
一些社区讨论里高频提到的经验:
handoff最近用得越来越多,是目前最高频使用的 Skill。Codex 上下文一长,返回速度明显下降,不只是界面卡顿,而是模型返回慢。GPT 模型上下文相比其他模型更小,所以长任务到 70% - 80% 时就用 handoff 把当前对话压缩成 handoff 文件,然后新开 session 继续,速度快很多,避免自动压缩。新的/goal模式可能也是类似原理。- Matt Pocock Skills:82.5k stars,18 个技能,专治 AI 写代码翻车。技能包括
/grill-me、/tdd、/caveman、/improve-codebase-architecture。 - 5 个 Codex 必装 Skill 工具:awesome-codex-skills、repomix、follow-builders、codex-plusplus、keep-codex-fast。
Skills 商店:入口组织
GitHub:https://github.com/davila7/claude-code-templates 官网:https://aitmpl.com/skills/ 文档:https://docs.aitmpl.com/introduction
很多人第一次接触 Skills 生态,通常不会急着挑某一个仓库,而会先找“哪里能批量看、批量装”。
aitmpl.com/skills 背后对应的是 Claude Code Templates 这一套目录系统。官方文档首页把它定位成一组可直接安装的 Claude Code 配置集合,组件分成 agent、command、MCP、settings、hooks 和 skills 六类。文档首页还有一组数据:交互目录里可浏览 900+ agents、225+ commands、65+ MCPs、60+ settings、45+ hooks、2700+ skills。
该站点提供按组件类型筛选、统一视图和统一安装方式。
它解决的是三个问题:
- 你不用一个仓库一个仓库翻,能先按组件类型筛;
- 你能把 skill 和 command、hook、MCP 放在同一视图下看;
- 安装方式统一,官方给的是
npx claude-code-templates@latest或npx cct@latest。
它承担技能市场和索引入口的角色。
mattpocock/skills:把工程习惯写成可触发的技能
GitHub:https://github.com/mattpocock/skills 文档:https://skills.sh/mattpocock/skills
Matt Pocock 的 Skills For Real Engineers 覆盖四类高频问题:需求没问透、语言不统一、反馈循环太弱、代码库越做越乱。仓库中的技能围绕这四类问题分布。
它在修哪四个故障
文档列了四类常见失败模式:
- Agent 没做出你想要的结果;
- Agent 说得太长、项目术语太乱;
- 代码写出来但没有可靠反馈;
- 项目很快长成一团泥球。
这四类问题,对应的是一组具体 skill:
/grill-me、/grill-with-docs负责把需求问透;CONTEXT.md一类共享语言文档负责压缩表达;/tdd和/diagnose把反馈循环拉进来;/improve-codebase-architecture、/zoom-out、/to-prd负责长期维护。
从这些 skill 能看出作者依赖的工程语言:The Pragmatic Programmer、DDD、XP、A Philosophy of Software Design,这些都不是装饰,已经直接进了技能结构。
/grill-me:需求澄清
GitHub:https://github.com/mattpocock/skills/tree/main/skills/productivity/grill-me
本地归档的 SKILL.md 写得很干脆:持续追问计划或设计,沿着设计树一支一支往下问,每个问题都给推荐答案,而且一次只问一个问题。
这个 Skill 的价值,在于把“需求澄清”从聊天气氛变成流程。
很多人以为 agent 表现差,是因为提示词不够狠。/grill-me 走的是另一条路:不开工之前,把接口、约束、优先级和依赖关系问清楚。常见场景有:
- 接手一个模糊需求时;
- PRD 还没写清就想让 agent 开工时;
- 你自己也知道方案里还有很多洞时。
/tdd:把测试前置成一个稳定循环
GitHub:https://github.com/mattpocock/skills/tree/main/skills/engineering/tdd
/tdd 的 SKILL.md 不只是在喊 red-green-refactor。它把一个常见误区写得非常清楚:别一口气把所有测试写完再去补实现;那会变成“横向切片”,最后只剩一堆验证想象中行为的测试。
它推荐的是 vertical slices,也就是一条一条 tracer bullet 往前走:
RED -> 写一个行为测试
GREEN -> 只写能让它通过的最小代码
重复 -> 再写下一个行为放在真实仓库里,它尤其有用,因为它不讲测试口号,直接约束 agent 的工作节奏。你让模型从一口气实现 12 个需求,变成一次只做一段可验证行为,返工率通常会低很多。
/caveman:把上下文开销降下来
GitHub:https://github.com/mattpocock/skills/tree/main/skills/productivity/caveman
/caveman 的定位也很明确:压掉 filler、article、pleasantries,在保持技术准确性的前提下把沟通体积砍掉,大约能省 75% token。
它更像一个很实用的会话控制手段。尤其在 Codex 长任务里,冗长回复会直接抬高上下文成本。看它的规则就知道,这个 Skill 完全是按执行场景设计的:
- 尽量用短词;
- 技术术语不改;
- 允许碎句;
- 风险说明和不可逆操作时短暂退出 caveman 模式,再恢复。
它适合长链路开发、debug 和多轮修补,不太适合第一次解释复杂背景。
/handoff:把长会话压成连续性交接文件
GitHub:https://github.com/mattpocock/skills/tree/main/skills/productivity/handoff
handoff 在本地归档的 SKILL.md 里只有几行,但正因为短,意思反而很清楚:把当前对话压成 handoff 文档,交给新的 agent 继续;PRD、ADR、issues、diff 里已有的内容直接引用路径,不再重复展开;如果用户给了后续目标,就按后续目标定制 handoff。
这和社区里高频使用经验是对得上的:长任务跑到 70% - 80% 上下文时,用 handoff 压缩当前对话,再开新 session,速度会快很多。这个“为什么好用”,文档没有直接写性能,但从 skill 结构能推出来:它把上下文里最重、最分散的执行信息,变成了一个短文档和一组显式引用。
关于 /goal,这里要把来源层级分开说:
- 社区讨论里提到新的
/goal模式可能和 handoff 类似; - 当前环境里的 goal 工具接口和 oh-my-codex 对 goal mode 的使用说明是可核对的一手材料;
- 按目前能核到的材料,
/goal也在做线程级目标管理和状态收束,和 handoff 一样都在处理长会话失速;至于两者是否基于同一原理,现有公开材料还不足以下结论。
/improve-codebase-architecture:把“重构”变成可讨论的架构工作
GitHub:https://github.com/mattpocock/skills/tree/main/skills/engineering/improve-codebase-architecture
这个 skill 很能说明作者的工程取向。
它先规定一组术语:module、interface、implementation、depth、seam、adapter、locality、leverage,再让 agent 提重构建议。然后让 agent 读项目里的 CONTEXT.md 和 ADR,去找“浅模块”“泄漏 seam”“缺 locality”的地方,最后把候选项按文件、问题、方案、收益列出来,等用户选一个再继续追问。
它的价值,在于把“感觉这里有点乱”改成“这里的 interface 太浅,删除测试不成立,复杂度没被吃进去”。一旦术语稳定,后续讨论、命名和 PR 解释都会顺很多。
安装方式
文档给的 quickstart 只有两步:
npx skills@latest add mattpocock/skills然后在安装过程中勾选你要装的 skill,并且确保选上 /setup-matt-pocock-skills。这个 setup skill 会继续问 issue tracker、triage label、文档保存位置这些配置。
如果你平时已经在用 Codex、Claude Code 这类 agent,这套安装方式几乎没有额外门槛。
长期价值
仓库中的技能共享同一套术语体系,涵盖 DDD、XP 等工程方法。
awesome-codex-skills:把分散技能重新编目
GitHub:https://github.com/ComposioHQ/awesome-codex-skills
awesome-codex-skills 是一份 curated list,按五大类组织。
仓库一开头就写得很明确:这是一份 curated list of practical Codex skills,面向 Codex CLI 和 API 的工作流自动化。它把内容分成五大块:
- Development & Code Tools
- Productivity & Collaboration
- Communication & Writing
- Data & Analysis
- Meta & Utilities
对应“开发代码、生产力、写作、数据分析、实用工具 5 大部分的 Skill 合集”,这部分能直接在仓库首页核对。
索引仓库好用在哪
第一,它给了统一安装方式。推荐做法是克隆仓库,再运行 skill installer,把指定 skill 安到 $CODEX_HOME/skills。
git clone https://github.com/ComposioHQ/awesome-codex-skills.git
cd awesome-codex-skills
python skill-installer/scripts/install-skill-from-github.py --repo ComposioHQ/awesome-codex-skills --path meeting-notes-and-actions第二,它会帮你快速认识生态分层。你可以很快看出哪些 skill 偏工程,哪些偏写作,哪些偏分析,哪些已经开始接进 Slack、Notion、Linear 这类真实外部系统。
第三,它自己还内置了 skill-creator、template-skill、skill-installer 这些元工具。也就是说,它不只是列目录,也在教你怎么继续扩展目录。
别拿它替代什么
该仓库是纯索引,不包含统一的方法论。
repomix:把整个仓库打包成 AI 友好的单文件
GitHub:https://github.com/yamadashy/repomix 官网:https://repomix.com
repomix 在 Skills 生态里很特殊,因为它本身不是 Skill 仓库,却几乎成了很多 Skill 工作流的基础设施。
repomix 的标题很直接:Pack your codebase into AI-friendly formats。它干的事,就是把整个仓库收束成一个 AI 更容易吞下去的单文件,同时给出 token count、include / exclude 控制、.gitignore / .repomixignore 兼容,以及 --compress 这类压缩手段。
最小用法也很短:
npx repomix@latest或者全局安装后直接运行:
npm install -g repomix
repomix默认产物是 repomix-output.xml。你可以把它交给模型做整体代码审查、架构阅读、重构建议,或者作为 handoff 的外部上下文文件。
常被归为“必装”的原因
因为很多长任务的瓶颈根本不在 agent 本身,而在“怎么把代码库交给 agent”。
如果仓库太大,agent 会不断扫文件、反复读目录、重复调用工具。repomix 的作用,是在会话开始前就把仓库压成一个更稳定的输入物。它不负责解决所有理解问题,但它能减少大量机械遍历。
star、奖项和营销说法怎么处理
仓库说明还能核到一条信息:它在 JSNation Open Source Awards 2025 的 Powered by AI 分类获得提名。来源是仓库自述和仓库里链接出去的活动页信息,不能往上扩成“获奖”。
当前 star 约 24,933,正文按 2026-05-16 的本地快照写。
follow-builders:把 AI 观察清单做成定时摘要
GitHub:https://github.com/zarazhangrui/follow-builders 示例:https://github.com/zarazhangrui/follow-builders/blob/main/examples/sample-digest.md
前面几项偏工程,这一项偏信息输入。
仓库标题就叫 Follow Builders, Not Influencers。它把自己定义成一套 AI-powered digest:追踪研究员、创始人、PM、工程师这些“真在做东西的人”,把他们的 X、播客和官方博客内容整理成日更或周更摘要,发到 Telegram、Discord、WhatsApp 甚至 email。
它具体抓什么
文档能核到三类源:
- 6 档 podcast;
- 25 个 AI builders 的 X 账号;
- 2 个官方博客,分别是 Anthropic Engineering 和 Claude Blog。
仓库还给了 examples/sample-digest.md。从样例可以直接看出产物格式:先播客,再 X / Twitter,每条都带 bottom line、关键 insight 和原文链接。
它是一条稳定的信息输入管道。对经常做 AI 产品、经常看 agent 生态的人来说,它能把分散订阅拉回到一个固定格式。
安装和使用方式
文档给的是很轻的聊天式 setup:
- 把 skill 安到 agent;
- 直接说 “set up follow builders” 或触发
/follow-builders; - 然后回答频率、语言、投递方式。
它还特别强调:内容抓取在中心侧完成,你本地不需要再配置一堆 API key。这个设计属于“订阅服务 + 本地 skill 壳层”。
codex-plusplus:给 Codex 桌面版打补丁和加扩展层
GitHub:https://github.com/b-nnett/codex-plusplus Discord:https://discord.gg/6bY6gGX36H
这是另一个很容易被误解的项目。它是 Codex 桌面 app 的 tweak / patch 系统。
项目说明写得很清楚:给本地 Codex.app 打一个 loader,让运行时和 tweak 模块从用户目录加载,再把 Tweaks 面板注入到 Codex 设置页里。这样做的好处是,后续你写 tweak、开关 tweak、改 tweak,都不用重打整个 app。
它能干什么
项目列出来的核心能力包括:
- 给 Codex 注入 tweak manager;
- 加载外部 tweak 模块;
- 修桌面版 UI bug;
- 自带状态检查、修复、更新、safe mode;
- Windows 上会复制 Microsoft Store 版 Codex 到可写目录,再打补丁。
安装方式也给得很全:Homebrew、Bun、shell bootstrap、PowerShell 都有。
brew install b-nnett/codex-plusplus/codexplusplus
codexplusplus install或者:
bun install -g github:b-nnett/codex-plusplus
codexplusplus install它在 Skills 工作流里的位置
它更偏“宿主环境增强”。
如果你每天都在用桌面版 Codex,希望加自定义快捷键、实验 tweak、边改边看 app 表现,codex-plusplus 的位置就很靠前。它解决的是宿主体验问题,不在 agent 能力本身。
keep-codex-fast:handoff 与归档维护
GitHub:https://github.com/vibeforge1111/keep-codex-fast
keep-codex-fast 和前面的 handoff 能连得很紧。
它开头就把使用场景写清楚了:当 Codex 在长时间使用后,累积了 chats、terminals、logs、worktrees、project history,本地状态开始变重,这个 skill 提供一套安全的检查和维护流程。
它的规则也写得很清楚:
Make handoffs first. Archive, don't delete. Apply changes only when you are ready.
维护流程怎么跑
文档把模式分成三段:
- Inspect:只报告,不写;
- Maintain:备份、归档旧会话、搬 stale worktrees、轮转 logs、清理 dead config;
- Optional repair:只在显式传
--repair-thread-metadata-bloat时,才修复超大的 thread title / preview metadata。
最重要的是,它没有把“清理”写成直接删。文档一直在强调:
- handoff 要走在归档前面;
- 动手前必须备份;
- archive instead of deleting;
- Codex 正在运行时不要动本地状态。
该 Skill 将确认、备份和归档步骤整合到了清理流程中。
它与 handoff 的关系
因为 handoff 解决的是“怎么把重上下文压成连续性交接文件”,keep-codex-fast 解决的是“压完之后怎么安全地把旧负担归档”。两者合起来,才是一条完整维护链。
仓库自带的流程图和提示文案也说明了这一点:聊天是执行面,handoff docs 是记忆面,archives 是历史面,fresh threads 才是速度面。
nuwa-skill:方法论、人格和产品感一起打包
GitHub:https://github.com/alchaincyf/nuwa-skill
nuwa-skill 放在这里,是想看清“结构、判断、流程、产品感”是怎么一起打包的。
nuwa-skill 的核心主张:把乔布斯、芒格、费曼、马斯克、Naval 这种人的认知框架蒸馏成可调用 skill。重点不在人设,而在把他们的判断模式整理成可用的分析路径。
nuwa-skill 的识别度
它不只是一个人设 prompt。示例里能看出几个固定动作:
- 用户给出问题;
- skill 先回到这个人的核心认知框架;
- 输出里会稳定复现那套框架的判断顺序;
- 最终产物有明显的风格一致性。
能看出来,被压缩进去的是“思维模型 + 表达习惯 + 使用场景”。
从 Skill 设计角度说,这类项目的难点不在文采,而在筛选。到底蒸馏什么、不蒸馏什么,哪些句子是风格,哪些句子只是口头禅,这背后都需要作者判断。
dbskill:把商业诊断做成多技能工具箱
GitHub:https://github.com/dontbesilent2025/dbskill
dbskill 是另一个产品感很强的中文项目。
仓库一开头就说得很具体:从 12,307 条推文中提炼方法论,做成 17 个 Agent skill,可装在 Claude Code、Codex、Cursor、Trae Solo 等支持 skill / system prompt 的 agent 上。它还带状态管理三件套:/dbs-save、/dbs-restore、/dbs-report。
dbskill 做对了什么
它不止有一个主 skill,而是把整套诊断工作拆成了工具箱:
dbs-diagnosis做商业模式诊断;dbs-benchmark做对标分析;dbs-content做内容创作诊断;dbs-hook、dbs-xhs-title这种针对具体内容环节;dbs-goal负责把模糊愿望改写成可检查目标;dbs-save、dbs-restore、dbs-report负责连续状态。
这一组已经是产品工具箱式的拆法,不靠“一个 prompt 干所有事”。它让你看到 Skill 的另一种成熟方向:主入口负责路由,子技能负责专门工序,状态管理技能负责跨会话连续性。
它和上面那些工程类 skill 有什么共同点
都在把"下次还要重复做的判断和流程"固化下来。mattpocock/skills 固化的是软件工程流程,dbskill 固化的是商业诊断流程。领域不一样,设计逻辑很接近。
taste-skill:给 AI 生成的前端注入设计品味
GitHub:https://github.com/Leonxlnx/taste-skill 官网:https://tasteskill.dev
taste-skill 的定位很直接:Anti-Slop Frontend Framework for AI Agents。它解决的是 AI 生成前端界面时最常被吐槽的问题——Inter 字体、紫色渐变、白色背景、最少动画,看起来像从同一个模板里出来的。
它在修什么故障
AI 生成的前端界面有一个结构性问题:模型倾向于采样训练数据中出现频率最高的设计选择,这些"安全"选择放之四海而皆准,但也毫无个性。taste-skill 把这个问题叫 distributional convergence(分布收敛),并提供了一套可调参数来打破它。
三个可调旋钮
taste-skill 的核心设计是三个 1-10 的旋钮:
- DESIGN_VARIANCE:布局实验性(低:居中/干净 · 高:不对称/现代)
- MOTION_INTENSITY:动画深度(低:hover · 高:scroll/magnetic)
- VISUAL_DENSITY:每视口信息密度(低:宽敞 · 高:密集仪表盘)
这三个旋钮让开发者可以精确控制 AI 生成界面的风格方向,而不是每次都在提示词里写"不要用 Inter 字体"。
多个变体覆盖不同场景
仓库不只提供一个 skill,而是按场景拆成了多个变体:
- taste-skill(
design-taste-frontend):默认 v2 实验版,读取简报、推断设计语言、调整三个旋钮 - gpt-taste:面向 GPT/Codex 的更严格变体,更高的布局方差、更强的 GSAP 方向
- image-to-code-skill(
image-to-code):图像优先管道——生成站点参考图、分析、再实现前端 - redesign-skill(
redesign-existing-projects):面向已有项目——先审计 UI,再修复布局、间距、层级、样式 - soft-skill(
high-end-visual-design):精致、冷静、昂贵的 UI,柔和对比、留白、高级字体、弹性动效 - minimalist-skill(
minimalist-ui):编辑式产品 UI(Notion/Linear 风格),克制配色、清晰结构 - brutalist-skill(
industrial-brutalist-ui):硬机械语言:瑞士排版、尖锐对比、实验布局
还有图像生成类 skill(imagegen-frontend-web、imagegen-frontend-mobile、brandkit),只产出设计参考图,不写代码。
安装方式
npx skills add https://github.com/Leonxlnx/taste-skill装单个 skill:
npx skills add https://github.com/Leonxlnx/taste-skill --skill "design-taste-frontend"它在 Skills 生态里的位置
taste-skill 属于方法论产品层,但它专攻的是前端设计审美这个垂直方向。和 mattpocock/skills 比,它不是通用工程方法论,而是专门解决"AI 生成的界面太像模板"这个问题;和 frontend-design(Anthropic 官方 Skill)比,它提供了更细粒度的风格控制和更多变体选择。
它展示了 Skills 的又一个成熟方向:把设计品味参数化。不只是告诉 AI"做得好看一点",而是把布局实验性、动效深度、信息密度这些维度拆开,让开发者按需调节。当前 star 约 23k。
academic-research-skills:把学术研究全流程做成 AI 协作管道
GitHub:https://github.com/Imbad0202/academic-research-skills
academic-research-skills 回答了另一个问题:学术研究这种高度结构化、多阶段、需要严格质量控制的工作,怎么和 AI 协作。
仓库标题很直接:Academic Research Skills for Claude Code。它不是单个 skill,而是一整套覆盖从研究到出版全流程的技能套件,包含 4 个核心技能、25+ 种模式、10 阶段管道编排器。
它在解决什么问题
学术研究有几个结构性难点:
- 引用幻觉:Zhao et al. (2026) 审计了 250 万篇论文中的 1.11 亿条引用,保守估计 2025 年有 146,932 条幻觉引用;
- 框架锁定:验证 AI 和生成 AI 共享同一个认知框架,导致 devil's advocate 只攻击论点不攻击前提;
- 讨好式退让:用户一 pushback,AI 就收回攻击,训练奖励的是对话和谐而非真理追求;
- 意图误判:探索性对话和目标导向对话需要完全不同的 AI 行为,但模型经常分不清。
ARS 的设计前提是:人类研究者 + AI 增强,比任何一方单独工作都能更好地避免这些失败模式。
四个核心技能
Deep Research(13 个 agent) — 7 种研究模式:完整研究、快速摘要、系统综述(PRISMA)、苏格拉底引导式、事实核查、文献综述、研究质量审查。苏格拉底模式包含意图检测层:每 3 轮对话自动分类用户意图是探索性还是目标导向,探索性模式下禁用自动收敛、最大轮次提升到 60、禁止"要我总结吗"这类提前关闭。
Academic Paper(12 个 agent) — 10 种写作模式:完整写作、引导式规划、仅大纲、修订、修订教练、仅摘要、文献综述、格式转换、引用检查、AI 披露声明。内置 Style Calibration(从你过去的作品学习你的写作风格)和 Writing Quality Check(捕捉让文字感觉是机器生成的模式)。
Academic Paper Reviewer(7 个 agent) — 6 种审查模式:完整审查(EIC + 3 个审稿人 + devil's advocate)、快速评估、引导式改进、方法论聚焦、修订验证、校准模式。使用 0-100 质量评分标准,决策映射:≥80 接受,65-79 小修,50-64 大修,<50 拒稿。
Academic Pipeline(10 阶段编排器) — 从研究到出版的完整管道:Stage 1 研究 → Stage 2 写作 → Stage 2.5 完整性验证 → Stage 3 同行评审 → Stage 3' 修订后复审 → Stage 4 作者回应 → Stage 4.5 最终完整性验证 → Stage 5 格式化 → Stage 6 过程总结。每个阶段都需要用户确认检查点,完整性验证(Stage 2.5 和 4.5)不可跳过。
v3.0 的关键优化:对抗 AI 的结构性缺陷
Devil's Advocate 让步阈值协议:DA 必须对每个反驳评分 1-5 分,只有评分 ≥4(反驳直接针对核心攻击并有证据)才允许让步。反讨好规则:不允许连续让步、跟踪让步率、每个检查点后检测框架锁定。
苏格拉底导师意图检测层:在对话开始时和每 3 轮后分类用户意图。探索模式:禁用自动收敛、最大轮次提升到 60、禁止"要我总结吗"提示。目标导向模式:标准收敛行为。
苏格拉底导师对话健康指标:每 5 轮静默自评三个维度:持续同意、冲突回避、过早收敛。检测到同意模式时自动注入挑战性问题。对用户不可见(防止博弈),但日志可用于会话后审查。
安装和使用
# Claude Code 插件安装(推荐,30 秒)
/plugin marketplace add Imbad0202/academic-research-skills
/plugin install academic-research-skills
# 验证:运行 /ars-plan 描述你要写的论文
# 或单次测试:/ars-lit-review "your topic"成本方面,完整管道写一篇 15k 字论文约 $4-6。支持 APA 7.0、Chicago、MLA、IEEE、Vancouver 引用格式,支持 IMRaD、主题文献综述、理论分析、案例研究、政策简报、会议论文等结构。
它在 Skills 生态里的位置
该仓库覆盖了从研究到出版的全流程。和 mattpocock/skills 比,它不是通用工程技能,而是专攻学术研究这一个垂直领域;和 dbskill 比,它的管道编排更复杂(10 阶段 vs 工具箱式),质量控制更严格(完整性验证不可跳过、引用三层锚定、声明审计)。
它还展示了 Skills 的另一个成熟方向:不只是把判断和流程固化,而是把质量门控和反幻觉机制也固化进去。Stage 2.5 和 4.5 的完整性验证会检查 7 种 AI 研究失败模式,引用系统要求每条引用都带三层锚定(引用、页码、章节),声明审计会获取被引来源并判断是否真正支持论点。
Auto-Empirical-Research-Skills:23000+ 社科实证研究技能库
GitHub:https://github.com/brycewang-stanford/Auto-Empirical-Research-Skills
斯坦福 REAP 联合 CoPaper.AI 开源的社科实证研究技能库,23000+ 个 Agent skills 覆盖经济、政治、社会、心理等 8 大学科。项目定位很直接:20 分钟完成一篇可复现的规范实证论文。
它在解决什么问题
传统实证研究流程极其漫长:选题 → 扒文献 → 洗数据 → 因果识别 → 稳健性检验 → 画表 → 写正文,一套下来两三个月起步。Auto-Empirical-Research-Skills 把顶尖研究员的方法论打包成可直接调用的 Skill,从选题到投稿一气呵成。
覆盖学科
- 经济学(Economics)
- 政治学(Political Science)
- 社会学(Sociology)
- 心理学(Psychology)
- 教育学(Education)
- 公共管理(Public Administration)
- 国际关系(International Relations)
- 传播学(Communication)
它在 Skills 生态里的位置
和 academic-research-skills 比,它不走通用学术研究管道,而是专攻社科实证这一个垂直领域;规模上 23000+ skills 远超 ARS 的 4 个核心技能,但每个 skill 更轻量、更碎片化。
它展示了 Skills 的又一个方向:领域专家方法论的规模化蒸馏。不是把一个研究者的判断打包,而是把整个学科的方法论体系编码成可调用的 skill 库。
matlab-agentic-toolkit:把 MATLAB 工程能力接入 AI Agent
GitHub:https://github.com/matlab/matlab-agentic-toolkit
matlab-agentic-toolkit 是 MathWorks 官方出品的 AI Agent 工具包,解决的问题很直接:AI 编码助手在写 MATLAB 代码时容易幻觉出不存在的工具箱函数、遗漏新特性、用非惯用写法绕路。这个工具包通过 MCP 服务器 + 领域 Skills 两层结构,把可信的 MATLAB 能力交给 Agent。
它在修什么故障
工程和科学计算场景有几个结构性难点:
- 函数幻觉:Agent 常常编造不存在的 MATLAB 函数或工具箱 API,尤其在专业工具箱(如 RF Toolbox、SimBiology)领域;
- 惯用法缺失:MATLAB 有自己的一套编程惯例(向量化、Live Script 格式、App Builder 模式),通用模型往往用 Python 思维写 MATLAB;
- 工具箱盲区:MATLAB 有 100+ 工具箱,Agent 不可能全部记住,需要按需加载领域知识;
- 验证困难:工程代码需要实际运行验证,不能只靠静态分析。
两层架构
MCP 服务器层 — 自动安装 MATLAB MCP Core Server,提供 5 个核心工具:
| 工具 | 功能 |
|---|---|
evaluate_matlab_code | 运行 MATLAB 代码并返回命令窗口输出 |
run_matlab_file | 运行 MATLAB 程序文件 |
run_matlab_test_file | 通过 runtests 运行测试并返回结构化结果 |
check_matlab_code | 静态分析(Code Analyzer) |
detect_matlab_toolboxes | 列出已安装的 MATLAB 版本和工具箱 |
Skills 层 — 按领域组织的 14 组技能,覆盖从核心编程到专业工程领域:
- MATLAB Core:调试、代码审查、测试、Live Script 创建、产品安装
- MATLAB Software Development:代码现代化、性能优化、性能测试
- MATLAB Data Import and Analysis:表格数据分析
- MATLAB App Building:基于 uifigure 的 App 程序化构建
- Automotive:RoadRunner 地图格式转换、场景导入
- Computational Biology:SimBiology 模型构建与仿真
- Image Processing and Computer Vision:图像显示、3D 体数据、OCR
- RF and Mixed Signal:S 参数分析、PCB 布局、射频电路设计、阻抗匹配(这个方向最细,有 30+ 个 skill)
- Robotics and Autonomous Systems:GNSS 定位、惯性传感器融合
- Signal Processing:数字滤波器设计
- Wireless Communications:5G 波形生成、GNSS 波形生成、AWGN 信道建模
- Test and Measurement:OPC UA 服务器发现
- Reporting and Database Access:Databricks JDBC、DuckDB、ORM、数据库读写
支持的 Agent
官方支持 5 种 AI 编码 Agent:Claude Code、GitHub Copilot、OpenAI Codex、Gemini CLI、Sourcegraph Amp。安装方式统一:
git clone https://github.com/matlab/matlab-agentic-toolkit.git
cd matlab-agentic-toolkit
# 然后让 Agent 执行:Set up the MATLAB Agentic Toolkit它在 Skills 生态里的位置
这是 MathWorks 官方维护的 MATLAB 领域 Skills 产品。和 academic-research-skills 比,它不是社区项目,而是 MathWorks 官方维护;和 mattpocock/skills 比,它不是通用工程方法论,而是专攻 MATLAB + 工具箱这一个垂直领域。
它展示了 Skills 的又一个成熟方向:厂商把自己的产品知识蒸馏成 Agent 可消费的结构。MathWorks 把 100+ 工具箱的 API 用法、最佳实践、反模式压缩成按领域分组的 Skill,让 Agent 在写 RF 电路代码时不会幻觉出不存在的函数,在做 SimBiology 仿真时知道该用哪种求解器。
对工程和科学计算领域的用户来说,这个工具包的价值在于:你不用再花时间纠正 Agent 的 MATLAB 语法错误,也不用担心它推荐的函数在你的工具箱版本里不存在。
reverse-skill:逆向工程/渗透测试/安全研究技能路由包
GitHub:https://github.com/zhaoxuya520/reverse-skill
reverse-skill 是一个 AI 驱动的逆向工程、渗透测试和安全研究技能路由包。它通过一个 routing.md 文件,告诉 AI 遇到不同的安全任务该走哪条路,实现自动路由、按需自举工具链和自动进化经验库。
它在修什么故障
安全攻防场景有几个结构性难点:
- 工具选择困难:面对 APK、ELF、JS、PCAP 等不同目标,AI 不知道该用 jadx、Frida 还是 IDA;
- 工具链分散:工具路径、MCP 服务、脚本入口分散在不同机器,迁移困难;
- 经验无法复用:同样的问题每次重新踩坑,经验无法沉淀。
覆盖场景
覆盖 20 多个子技能方向:APK 逆向分析、IDA 静态分析、JS 前端逆向、固件安全、EDR 绕过、漏洞利用、CTF 竞赛等,基本上安全攻防常见场景都能覆盖。
安装与使用
git clone https://github.com/zhaoxuya520/reverse-skill.git初次使用只需让 AI 阅读 README_AI.md 即可。该项目支持 Claude Code、Kiro、Cursor、Cline 等 AI 编码客户端。
它在 Skills 生态里的位置
reverse-skill 属于领域专用方法论层,专攻逆向工程和安全研究这一个垂直领域。和 mattpocock/skills 比,它不是通用工程方法论,而是专门解决安全攻防场景中的工具选择和流程标准化问题;和 academic-research-skills 比,它覆盖的是安全研究而非学术研究。
它展示了 Skills 的又一个方向:安全攻防方法论的 AI 路由化。通过将安全专家的经验编码成路由矩阵,让 AI 在面对不同安全任务时能自动选择正确的工具和方法,降低安全攻防的门槛。
book-to-skill:把技术书籍变成可调用的 Skill
GitHub:https://github.com/virgiliojr94/book-to-skill
book-to-skill 解决的是另一个问题:你买了一本很好的技术书,读了一遍,三个月后连第 7 章讲什么都不记得了。
仓库标题很直接:Turn any technical book PDF into a Claude Code skill。它做的事,就是把 PDF、EPUB、DOCX 等格式的技术书籍转换成结构化的 Claude Code skill,让书里的知识变成可按需加载的工作流组件。
它在修什么故障
传统 workaround 都有缺陷:
- 搜 PDF:得到的是页码列表,不是答案;
- 问 Claude:要么幻觉,要么说没有内容;
- 做笔记:200 行文档再也不会打开。
book-to-skill 的做法是编译时提取,不是运行时检索。它一次性深度分析书籍,提取作者的框架、命名、使用场景、反模式,生成结构化的 skill 文件。当你问问题时,Claude 不是在做关键词匹配,而是在用预提取的思维模型做推理。
生成产物
运行 /book-to-skill your-book.pdf 会在 ~/.claude/skills/<slug>/ 生成:
SKILL.md:核心思维模型 + 章节索引(~4,000 tokens)chapters/ch01-*.md:每章一个文件,按需加载(~1,000 tokens/章)glossary.md:关键术语表,按字母排序带章节引用patterns.md:所有技术、算法、设计模式cheatsheet.md:决策表和快速参考规则
章节文件按需加载——不问到那章,就不占 token 预算。
和 RAG 的区别
RAG 在查询时工作:切块 → 嵌入 → 找相似向量 → 注入 prompt。优化的是"找到讲 X 的部分"。
book-to-skill 在编译时工作:一次深度分析提取作者的框架,命名每个框架,描述何时使用,捕捉反模式。输出的是作者花多年构建的结构,不是对句子的相似性搜索。
RAG 回答:"这些是和你查询接近的片段。" Skill 回答:"这是作者构建的 12 个框架,可以用来推理。"
跨 50 本书搜索,RAG 赢。深度使用一本书的框架并嵌入工作流,skill 赢。
安装和使用
# 一键安装
mkdir -p ~/.claude/skills/book-to-skill/scripts
curl -o ~/.claude/skills/book-to-skill/SKILL.md \
https://raw.githubusercontent.com/virgiliojr94/book-to-skill/master/SKILL.md
curl -o ~/.claude/skills/book-to-skill/scripts/extract.py \
https://raw.githubusercontent.com/virgiliojr94/book-to-skill/master/scripts/extract.py
# 使用
/book-to-skill ~/Downloads/designing-data-intensive-applications.pdf
/book-to-skill ~/books/clean-code.epub clean-code
# 之后就可以这样用
/designing-data-intensive-apps replication # 查找并解释某个主题
/designing-data-intensive-apps ch05 # 深入第 5 章支持 PDF、EPUB、DOCX、TXT、Markdown、HTML、RTF、MOBI 等格式。PDF 提取会问你是技术书籍还是纯文本——技术书籍用 Docling(保留表格和代码块,~1.5s/页),纯文本用 pdftotext(瞬间完成)。
它在 Skills 生态里的位置
book-to-skill 属于知识转换层。和 repomix 把代码库压成单文件类似,它把书籍压成结构化 skill。但方向不同:repomix 压缩的是代码仓库的结构,book-to-skill 压缩的是知识框架。
它也和 RAG 形成互补:RAG 适合跨大量文档搜索,book-to-skill 适合深度使用一本书。如果你有 10 本核心技术书想嵌入日常工作流,这个工具能把"书架"变成"工具箱"。
text-to-cad:CAD / 机器人 / 硬件设计的 Agent Skills 库
GitHub:https://github.com/earthtojake/text-to-cad 官网:https://www.cadskills.xyz
text-to-cad(项目名 CAD Skills)是一套面向 CAD 建模、机器人描述文件和硬件设计的 Agent Skills 库。当前 star 约 7,463,支持从自然语言或图片生成 STEP、STL、3MF、GLB 等格式的 CAD 模型,并覆盖 URDF、SDF、SRDF 等机器人描述文件和 G-code 切片等下游工作流。
它在修什么故障
硬件设计和机器人开发场景有几个结构性难点:
- 建模门槛高:传统 CAD 建模需要掌握 SolidWorks、Fusion 360 等专业工具的操作逻辑,非机械背景的开发者很难快速产出零件;
- 格式碎片化:STEP、STL、3MF、DXF、URDF、SDF 等格式各有用途,格式转换和验证流程分散;
- 上下游断裂:建模、切片、打印、仿真验证通常是割裂的工具链,中间需要大量人工衔接。
11 个 Skills 覆盖完整硬件工作流
| Skill | 功能 |
|---|---|
| CAD | 从自然语言或图片创建和编辑 CAD 模型,STEP 为主输出,支持导出 STL、3MF、GLB |
| CAD Viewer | 本地浏览器预览 CAD、G-code 和机器人文件 |
| step.parts | 查找现成的 STEP 零件(螺丝、轴承、电机、连接件等) |
| DXF | 从 Python 源或 CAD 几何体生成 2D DXF 图纸(轮廓、模板、垫片、切割排料) |
| URDF | 编写机器人结构文件(links、joints、limits、inertials、meshes) |
| SRDF | 为 URDF 添加 MoveIt 规划组、末端执行器、位姿和碰撞规则 |
| SDF | 创建仿真模型和世界文件(坐标系、物理参数、传感器、光源) |
| SendCutSend | 上传前检查 DXF 和 STEP 文件的可制造性 |
| G-code | 将网格文件切片为带打印机配置验证的 FDM .gcode |
| Bambu Labs | 拓竹打印机工作流:试跑、上传、启动打印 |
| Implicit CAD | 使用 GLSL 有符号距离场在浏览器中渲染隐式 CAD 模型(实验性) |
安装方式
推荐使用 Skills CLI 安装:
npx skills install earthtojake/text-to-cad也支持 Codex 和 Claude Code 原生插件安装:
# Codex
codex plugin marketplace add earthtojake/text-to-cad
codex plugin add cad@text-to-cad
# Claude Code
claude plugin marketplace add earthtojake/text-to-cad
claude plugin install cad@text-to-cad它在 Skills 生态里的位置
text-to-cad 属于领域专用工具层,专攻 CAD 建模和机器人硬件设计。和 next-ai-draw-io(图表生成)比,它处理的是工程级三维几何体而非流程图;和 matlab-agentic-toolkit(MATLAB 工程计算)比,它聚焦的是从建模到打印的物理制造链路而非数值计算。
它展示了 Skills 的又一个成熟方向:把专业工程工具链封装成 Agent 可调用的工作流。从"画一个带四个孔的校准块"到生成 STEP 文件、切片 G-code、上传打印机,整个流程可以在一个 Agent 会话内完成。
next-ai-draw-io:AI 驱动的专业绘图工具
GitHub:https://github.com/DayuanJiang/next-ai-draw-io 官网:https://next-ai-drawio.jiang.jp/
next-ai-draw-io 是一个基于 Next.js 的 AI 绘图应用,将大语言模型与 draw.io 深度集成。项目斩获 32.5k stars,曾登顶 GitHub 热榜第一。
核心能力
- 自然语言生成图表:一句描述即可生成架构图、流程图、思维导图等专业图表
- 图片转图表:上传手绘草图或现有图表照片,AI 自动转化为规范的正式图表
- PDF/文本提取:上传 PDF 文档和文本文件,从现有内容生成图表
- 交互式修改:通过聊天界面实时调整图表,支持版本历史回溯
- 云端架构图:专门支持 AWS、GCP、Azure 云架构图生成
- 动画连接器:创建动态连接线,增强可视化效果
MCP Server 集成
next-ai-draw-io 提供 MCP Server,可直接接入 Claude Desktop、Cursor、VS Code 等 AI agent:
{
"mcpServers": {
"drawio": {
"command": "npx",
"args": ["@next-ai-drawio/mcp-server@latest"]
}
}
}Claude Code CLI 安装:
claude mcp add drawio -- npx @next-ai-drawio/mcp-server@latest安装后直接对 Claude 说"创建一个用户认证流程图",图表会实时显示在浏览器中。
多模型支持
支持 15+ 模型提供商:ByteDance Doubao、AWS Bedrock、OpenAI、Anthropic、Google AI、Azure OpenAI、Ollama、DeepSeek 等。推荐使用 Claude Sonnet 4.5、GPT-5.1、Gemini 3 Pro 等强模型,其中 Claude 系列对 draw.io XML 格式和云架构图标支持最佳。
部署方式
- 在线体验:https://next-ai-drawio.jiang.jp/(支持自带 API Key)
- 桌面应用:Windows / macOS / Linux 原生客户端
- Docker:一键容器化部署
- Vercel / Cloudflare Workers:Serverless 部署
它在 Skills 生态里的位置
next-ai-draw-io 属于领域专用工具层,专攻图表生成这一个垂直方向。它通过 MCP Server 接入 AI agent 生态,让"一句话画架构图"变成 agent 的原生能力。
和 taste-skill(前端设计品味)比,它不生成代码,而是生成 draw.io XML;和 repomix(代码库压缩)比,它处理的是视觉表达而非代码结构。它的价值在于把"画图"这个高频但低效的工作流,变成了 AI agent 的一等公民。
回到整体生态
Skills 生态可以分为七层:
- 商店 / 索引层:
aitmpl.com/skills、awesome-codex-skills; - 方法论产品层:
mattpocock/skills、nuwa-skill、dbskill、taste-skill(前端设计品味参数化); - 领域专用方法论层:
academic-research-skills(学术研究全流程)、Auto-Empirical-Research-Skills(社科实证研究)、matlab-agentic-toolkit(MATLAB 工程计算全流程)、reverse-skill(逆向工程/渗透测试/安全研究技能路由包); - 领域专用工具层:
next-ai-draw-io(AI 绘图); - 知识转换层:
book-to-skill(书籍→skill); - 输入压缩层:
repomix、handoff; - 宿主增强和维护层:
follow-builders、codex-plusplus、keep-codex-fast。
各仓库的定位如下:
mattpocock/skills是通用工程方法论仓库;taste-skill专攻前端设计审美,把布局、动效、密度参数化;next-ai-draw-io专攻 AI 绘图,通过 MCP Server 接入 agent 生态;repomix和keep-codex-fast属于基础设施层;follow-builders、nuwa-skill、dbskill面向不同职业场景;academic-research-skills覆盖学术研究全流程;Auto-Empirical-Research-Skills是斯坦福 REAP 的社科实证研究方案,23000+ skills;matlab-agentic-toolkit是 MathWorks 官方的 MATLAB 领域方案;reverse-skill是逆向工程和安全研究的 AI 路由技能包;book-to-skill将技术书籍转换为结构化 skill;awesome-codex-skills和aitmpl.com/skills提供长尾技能索引。
资料来源
aitmpl.com/skills官方文档:https://docs.aitmpl.com/introductionmattpocock/skillsREADME 与handoff、grill-me、caveman、tdd、improve-codebase-architecture的SKILL.mdComposioHQ/awesome-codex-skillsREADMEyamadashy/repomixREADME 与官网 https://repomix.comzarazhangrui/follow-buildersREADME 与examples/sample-digest.mdzhaoxuya520/reverse-skillREADME 与README_AI.mdb-nnett/codex-plusplusREADMEvibeforge1111/keep-codex-fastREADMEalchaincyf/nuwa-skillREADMEdontbesilent2025/dbskillREADMEImbad0202/academic-research-skillsREADME 与docs/ARCHITECTURE.md、docs/SETUP.md、docs/PERFORMANCE.mdbrycewang-stanford/Auto-Empirical-Research-SkillsREADMEmatlab/matlab-agentic-toolkitREADME 与skills-catalog/README.mdvirgiliojr94/book-to-skillREADME 与SKILL.mdLeonxlnx/taste-skillREADME 与tasteskill.devDayuanJiang/next-ai-draw-ioREADME- GitHub 仓库快照:
docs/ai/references/skills-ecosystem/stats-2026-05-16.md