编辑文档 - 白嫖党狂喜：用这个 4,580 颗星的 Skill + 免费生图模型，给公众号配出统一风格的高质量图

标题

工具栏

点击或拖拽上传图片

支持 PNG, JPG, GIF, WebP 格式

内容 (Markdown 格式)

配图这件事，做公众号的人都懂——前两篇风格还在线，第三篇开始 AI 给你画成 PPT 信息图，第五篇直接画风跳到另一个次元的卡通人。

最近发现一套「白嫖方案」：**xiaohei Skill + Agnes Image 2.1 Flash 免费模型**。一个管风格 DNA，一个管出图，全程基本不花钱。生成的图我放到「创见 AI 实验室」IP 上跑了一遍，效果出乎意料。

今天把这套免费流水线拆给你。

## 先说结论：能白嫖到什么程度

- **Skill**：`helloianneo/ian-xiaohei-illustrations`，4,580 stars，MIT 协议，永久免费
- **生图模型**：Agnes Image 2.1 Flash（`https://agnes-ai.com` 提供），注册就送额度，目前看**没有限量**，相当于白嫖
- **付费模型也能接**：OpenAI DALL-E、Midjourney、SDXL 都可以换。**有预算的话用收费模型效果会更好**——细节更精细、笔触更稳、中文标注更准。但**白嫖版已经能跑通整个流程**，适合先跑通再升级

Agnes API Key 注册路径：去 `https://agnes-ai.com` 注册账号 → 控制台拿 Key → 写到 `.env` 文件里（变量名 `AGNES_API_KEY`）。

## Skill 是什么：一句话讲清楚

xiaohei Skill 不是 prompt 模板，是一套**约束 AI 配图风格**的规则集。它解决的是「AI 画图风格乱跳」这个老问题：

- 固定一个角色 IP（默认叫「小黑」，**这个我们后面会换成「小创」**）
- 固定 8 种构图结构（Workflow / 系统局部 / 前后对比 / 角色状态 / 概念隐喻 / 方法分层 / 地图路线 / 小漫画分镜）
- 固定视觉 DNA（纯白背景、黑色手绘线稿、40-60% 留白、少量红橙蓝中文批注）
- 内置 QA checklist（自动跑检查，失败重生成）

所有规则拆成 markdown 文档，AI Agent 直接读然后自己组装 prompt。这套设计**和 prompt 模板最大的区别是：模板只解决单张图，Skill 解决跨文章一致性**。

## 装到 OpenCode / pi / Hermes

xiaohei 原生是 Codex Skill，但它是 markdown 文档，不绑死任何 Agent。**OpenCode、pi、Hermes 都能装**：

**OpenCode**：

```bash
git clone https://github.com/helloianneo/ian-xiaohei-illustrations.git
mkdir -p ~/.config/opencode/skills
cp -R ian-xiaohei-illustrations/ian-xiaohei-illustrations ~/.config/opencode/skills/
```

**pi**：

```bash
mkdir -p ~/.pi/skills
cp -R ian-xiaohei-illustrations/ian-xiaohei-illustrations ~/.pi/skills/
```

**Hermes**：

```bash
mkdir -p ~/.hermes/skills
cp -R ian-xiaohei-illustrations/ian-xiaohei-illustrations ~/.hermes/skills/
```

装完在 Agent 里说 `Use $ian-xiaohei-illustrations` 就能引用。

## 第一步：换 IP，把小黑换成「小创」

原版小黑是「黑色实心小怪物、白点眼、细腿」。我把它换成**「创见 AI 实验室」的形象 IP「小创」**——

**小创 IP 定义**：
- 17 岁少年脸，圆润线条，圆眼睛带高光
- 黑色短发，刘海偏分，左耳戴单只黑色蓝牙耳机
- 穿着：米色连帽卫衣 + 灰色工装短裤 + 黑色运动鞋 + 左手腕戴黑色电子表
- 胸口印「创见 AI 实验室」小字 logo（不抢眼，但能识别）
- 表情：专注、好奇、偶尔带一点得意
- 标志动作：单手叉腰、推眼镜（无眼镜时改成摸下巴）、举大拇指、趴桌上盯屏幕

改法是直接改 `references/` 里的三个 markdown：

- `xiaohei-ip.md` → 重写为小创的角色定义
- `prompt-template.md` → 替换 prompt 里的「小黑」为「小创」，加入新形象描述
- `composition-patterns.md` → 补充姿势库（举大拇指、摸下巴、趴桌等）

跑一遍，AI 自动用新角色——**这就是 Skill 化设计的好处，改一个文件全链路生效**。

## 第二步：5 个测试实例

我跑了 5 张图做测试，主题来自最近 5 篇文章。每张图我都按 Skill 的规范走完了「shot list → 选结构 → 写 prompt → 出图」完整流程。

### 实例 1：Workflow 结构 — 公众号配图流程

**文章主题**：「AI 写公众号的完整流程」

**核心认知锚点**：文章配图不是一步到位，是「消化正文 → 提炼认知锚点 → 选结构 → 设计动作 → 出图」5 步流水线。

**结构选择**：Workflow（流程图）

**画面描述**：

> 小创站在一条传送带左边，单手拿起「中文文章」放上传送带；传送带上有 5 个工位（消化、提炼、选结构、写 prompt、生图），每个工位上方挂一个红色箭头标签；传送带最右边，3 张配图从出口滑落到桌面上。
> 主体占比 50%，左侧大量留白写标题「公众号配图流水线」。
> 红色批注：「先消化，再画图」；蓝色批注：「3 张 / 篇」。

**小创动作**：单手叉腰看着传送带运转。

**生成 prompt 关键参数**：
- 比例：16:9（1920×1080）
- 风格：白底 + 黑色手绘线稿 + 少量红橙蓝批注
- 角色 IP：使用小创（米色卫衣 + 短发 + 单只蓝牙耳机）
- 留白：≥35%

> **【图片占位 1】** workflow_structure_for_wechat_illustration.png

---

### 实例 2：系统局部 — 一篇长文怎么拆成 5 张图

**文章主题**：「如何把一篇长文拆成多张配图」

**核心认知锚点**：长文不是 1 张大图，是 N 张小图。每张图只表达文章里的 1 个核心判断，N 张图形成序列。

**结构选择**：系统局部（局部放大）

**画面描述**：

> 画面左侧 1/3 是「文章」轮廓——长条形纸张上写满文字（用乱码符号代替）。
> 画面右侧 2/3 是「配图阵列」——5 张缩略图横向排列，每张图下方挂一个橙色标签，标签上写文章里的关键词。
> 小创站在「文章」和「配图阵列」中间，背对读者，一手指着右侧 5 张图。
> 蓝色批注：「1 篇 → 5 图」；红色批注：「每图 1 事」。

**小创动作**：背对读者、单手指向配图阵列。

**生成 prompt 关键参数**：
- 比例：16:9
- 留白：≥40%
- 角色：背对视角（首次测试背身动作）

> **【图片占位 2】** article_to_5_illustrations_decomposition.png

---

### 实例 3：概念隐喻 — 「信任账户」

**文章主题**：「写公众号就是往信任账户里存钱」

**核心认知锚点**：信任不是讲道理讲出来的，是一笔一笔存出来的。可以借（透支信任）但必须还（持续输出）。

**结构选择**：概念隐喻

**画面描述**：

> 画面中央是一个透明玻璃罐子，罐子外形像存钱罐，顶部是一个漏斗口。罐子里堆着大量「硬币」——硬币上写「干货」「真实」「踩坑」等词。
> 罐子前方蹲着一个小创，单手把硬币从漏斗口投进罐子。
> 罐子底部有一行橙色字：「信任账户」。
> 红色批注：「存进去的是信用」；蓝色批注：「透支要还」。

**小创动作**：蹲姿、单手投币、专注。

**生成 prompt 关键参数**：
- 比例：16:9
- 视觉焦点：玻璃罐（透明质感 + 笔触清爽）
- 角色：蹲姿（首次测试非站立姿势）

> **【图片占位 3】** trust_account_metaphor.png

---

### 实例 4：前后对比 — 「AI 配图」vs「Skill 配图」

**文章主题**：「为什么你的 AI 配图风格老崩」

**核心认知锚点**：通用 prompt 画的 5 张图，5 种画风；xiaohei Skill 画的 5 张图，1 种画风（5 个不同动作）。

**结构选择**：前后对比

**画面描述**：

> 画面左右对称分两栏。
> 左栏标题：「直接 prompt」——5 个形态各异的小卡通人（有的胖、有的瘦、有的萌、有的丑）杂乱排列，每人身上有不同风格的衣服。底部红色字：「5 张图 / 5 张脸」。
> 右栏标题：「xiaohei Skill」——5 个一模一样的小创，但每个做不同动作（推眼镜、趴桌、举拇指、摸下巴、叉腰）。底部绿色字：「5 张图 / 1 个 IP」。
> 中间用一条红色虚线分隔。

**小创动作**：左右各 5 个（10 个小创）。

**生成 prompt 关键参数**：
- 比例：16:9
- 角色重复：10 次（测试角色一致性）
- 强调：左右 5 个小创的「一致性」对比

> **【图片占位 4】** before_after_ai_skill_comparison.png

---

### 实例 5：小漫画分镜 — 「AI 配图 3 件套」使用流程

**文章主题**：「公众号配图工具的 3 件套」

**核心认知锚点**：用 AI 给公众号配图，只需 3 步——选 Skill、换 IP、跑流程。

**结构选择**：小漫画分镜（3 格）

**画面描述**：

> 画面是横排 3 格漫画，从左到右：
> **第 1 格**：小创站在 GitHub 仓库前，仓库外形是一个方块，上面写着「ian-xiaohei-illustrations」。小创单手指向仓库。蓝色字：「第 1 步：装 Skill」。
> **第 2 格**：小创坐在电脑前，屏幕显示 markdown 文档（`xiaohei-ip.md`），小创单手敲键盘。红色字：「第 2 步：换 IP」。
> **第 3 格**：小创站在一个「流水线」出口处，传送带运出 3 张配图，小创叉腰得意。绿色字：「第 3 步：跑流程」。
> 3 格之间用细黑线分隔，下方是统一标题「公众号配图 3 件套」。

**小创动作**：3 个不同姿态（指仓库、敲键盘、叉腰）。

**生成 prompt 关键参数**：
- 比例：16:9
- 分镜：3 等分横排
- 角色：3 个不同姿态（测试多动作一致性）

> **【图片占位 5】** comic_strip_3_step_workflow.png

---

## 第三步：白嫖的 2 个关键点

跑完 5 张图我总结了下，要真正白嫖到稳定效果，**有 2 个关键点**：

**1. 准备一张参考图锁定角色 IP**

不准备参考图，AI 每次对小创的文字理解都有偏差（虽然 Skill 把角色定义写得很细，但图模型对「黑色短发少年 + 米色卫衣」的理解每次都差一点点）。**给一张小创的参考图用 img2img 锁形象**，所有图角色识别度从 60% → 95%。

```python
extra_body = {
    "image": ["data:image/png;base64,..."],  # 小创参考图
    "response_format": "b64_json"
}
```

**2. 第一次跑用小尺寸（512×512）测 API**

1920×1080 大图生成要 2-3 分钟，**第一次调 API 容易超时**。先用 512×512 跑一次确认 API 通了、IP 形象对了，再切大图出最终版。

## 免费 vs 付费：怎么选

**白嫖版（Agnes Image 2.1 Flash）能做什么**：
- 风格一致的角色 IP 配图
- 5-10 张/天的批量配图
- 公众号正文插图、个人博客图、知识付费课程图
- 质量和 Midjourney V6 接近 70-80%，但风格 DNA 一致性比 MJ 还稳

**付费模型（OpenAI DALL-E / Midjourney / SDXL）** 适合：
- 商业级海报、品牌 KV
- 复杂多人场景、电影质感
- 中文标注准确度要求极高（生图模型对中文一直是老大难）

**我的建议**：先用白嫖版跑通整个流程，验证 Skill 的设计是不是你需要的。**有预算了再换付费模型**。Skill 本身（规则文件）不变，只是换了一个生图后端。

## 适合谁

- **写公众号 / 博客**，需要稳定配图风格的人
- **知识型内容创作者**（方法论、流程、概念解释）
- **用 AI Agent 做内容生产**，希望视觉风格资产化的人
- **一人公司 / 小团队**——一个人也能产出统一风格的内容
- **预算有限的学生 / 独立开发者**——这套方案几乎不花钱

## 不适合谁

- 要商业插画 / 品牌 KV / 精致扁平插画
- 要儿童卡通 / 可爱 IP / 表情包风格
- 要在一张图里塞大量文字
- 需要可编辑矢量源文件

## 最后

这套方案的核心价值不是「白嫖」，是**「稳定地生同一种风格的图」**。单张图质量不是关键，关键是你能连续产 50 张图都看起来像一个人画的。

Agnes 模型目前没看到限量通知，**注册就能用**，先到先得白嫖窗口。

去 `https://agnes-ai.com` 注册 → 装 xiaohei Skill → 改 IP → 跑流程——30 分钟出第一张图，2 小时出第一篇配图齐的公众号文章。

摘要

标签多个标签用逗号分隔

分类