📄 文档列表
🎬 口播文案
✏️ 编辑文档
标题
工具栏
加粗
H2 标题
H3 标题
引用
无序列表
有序列表
代码块
📷 上传图片
点击或拖拽上传图片
支持 PNG, JPG, GIF, WebP 格式
内容 (Markdown 格式)
配图这件事,做公众号的人都懂——前两篇风格还在线,第三篇开始 AI 给你画成 PPT 信息图,第五篇直接画风跳到另一个次元的卡通人。 最近发现一套「白嫖方案」:**xiaohei Skill + Agnes Image 2.1 Flash 免费模型**。一个管风格 DNA,一个管出图,全程基本不花钱。生成的图我放到「创见 AI 实验室」IP 上跑了一遍,效果出乎意料。 今天把这套免费流水线拆给你。 ## 先说结论:能白嫖到什么程度 - **Skill**:`helloianneo/ian-xiaohei-illustrations`,4,580 stars,MIT 协议,永久免费 - **生图模型**:Agnes Image 2.1 Flash(`https://agnes-ai.com` 提供),注册就送额度,目前看**没有限量**,相当于白嫖 - **付费模型也能接**:OpenAI DALL-E、Midjourney、SDXL 都可以换。**有预算的话用收费模型效果会更好**——细节更精细、笔触更稳、中文标注更准。但**白嫖版已经能跑通整个流程**,适合先跑通再升级 Agnes API Key 注册路径:去 `https://agnes-ai.com` 注册账号 → 控制台拿 Key → 写到 `.env` 文件里(变量名 `AGNES_API_KEY`)。 ## Skill 是什么:一句话讲清楚 xiaohei Skill 不是 prompt 模板,是一套**约束 AI 配图风格**的规则集。它解决的是「AI 画图风格乱跳」这个老问题: - 固定一个角色 IP(默认叫「小黑」,**这个我们后面会换成「小创」**) - 固定 8 种构图结构(Workflow / 系统局部 / 前后对比 / 角色状态 / 概念隐喻 / 方法分层 / 地图路线 / 小漫画分镜) - 固定视觉 DNA(纯白背景、黑色手绘线稿、40-60% 留白、少量红橙蓝中文批注) - 内置 QA checklist(自动跑检查,失败重生成) 所有规则拆成 markdown 文档,AI Agent 直接读然后自己组装 prompt。这套设计**和 prompt 模板最大的区别是:模板只解决单张图,Skill 解决跨文章一致性**。 ## 装到 OpenCode / pi / Hermes xiaohei 原生是 Codex Skill,但它是 markdown 文档,不绑死任何 Agent。**OpenCode、pi、Hermes 都能装**: **OpenCode**: ```bash git clone https://github.com/helloianneo/ian-xiaohei-illustrations.git mkdir -p ~/.config/opencode/skills cp -R ian-xiaohei-illustrations/ian-xiaohei-illustrations ~/.config/opencode/skills/ ``` **pi**: ```bash mkdir -p ~/.pi/skills cp -R ian-xiaohei-illustrations/ian-xiaohei-illustrations ~/.pi/skills/ ``` **Hermes**: ```bash mkdir -p ~/.hermes/skills cp -R ian-xiaohei-illustrations/ian-xiaohei-illustrations ~/.hermes/skills/ ``` 装完在 Agent 里说 `Use $ian-xiaohei-illustrations` 就能引用。 ## 第一步:换 IP,把小黑换成「小创」 原版小黑是「黑色实心小怪物、白点眼、细腿」。我把它换成**「创见 AI 实验室」的形象 IP「小创」**—— **小创 IP 定义**: - 17 岁少年脸,圆润线条,圆眼睛带高光 - 黑色短发,刘海偏分,左耳戴单只黑色蓝牙耳机 - 穿着:米色连帽卫衣 + 灰色工装短裤 + 黑色运动鞋 + 左手腕戴黑色电子表 - 胸口印「创见 AI 实验室」小字 logo(不抢眼,但能识别) - 表情:专注、好奇、偶尔带一点得意 - 标志动作:单手叉腰、推眼镜(无眼镜时改成摸下巴)、举大拇指、趴桌上盯屏幕 改法是直接改 `references/` 里的三个 markdown: - `xiaohei-ip.md` → 重写为小创的角色定义 - `prompt-template.md` → 替换 prompt 里的「小黑」为「小创」,加入新形象描述 - `composition-patterns.md` → 补充姿势库(举大拇指、摸下巴、趴桌等) 跑一遍,AI 自动用新角色——**这就是 Skill 化设计的好处,改一个文件全链路生效**。 ## 第二步:5 个测试实例 我跑了 5 张图做测试,主题来自最近 5 篇文章。每张图我都按 Skill 的规范走完了「shot list → 选结构 → 写 prompt → 出图」完整流程。 ### 实例 1:Workflow 结构 — 公众号配图流程 **文章主题**:「AI 写公众号的完整流程」 **核心认知锚点**:文章配图不是一步到位,是「消化正文 → 提炼认知锚点 → 选结构 → 设计动作 → 出图」5 步流水线。 **结构选择**:Workflow(流程图) **画面描述**: > 小创站在一条传送带左边,单手拿起「中文文章」放上传送带;传送带上有 5 个工位(消化、提炼、选结构、写 prompt、生图),每个工位上方挂一个红色箭头标签;传送带最右边,3 张配图从出口滑落到桌面上。 > 主体占比 50%,左侧大量留白写标题「公众号配图流水线」。 > 红色批注:「先消化,再画图」;蓝色批注:「3 张 / 篇」。 **小创动作**:单手叉腰看着传送带运转。 **生成 prompt 关键参数**: - 比例:16:9(1920×1080) - 风格:白底 + 黑色手绘线稿 + 少量红橙蓝批注 - 角色 IP:使用小创(米色卫衣 + 短发 + 单只蓝牙耳机) - 留白:≥35% > **【图片占位 1】** workflow_structure_for_wechat_illustration.png --- ### 实例 2:系统局部 — 一篇长文怎么拆成 5 张图 **文章主题**:「如何把一篇长文拆成多张配图」 **核心认知锚点**:长文不是 1 张大图,是 N 张小图。每张图只表达文章里的 1 个核心判断,N 张图形成序列。 **结构选择**:系统局部(局部放大) **画面描述**: > 画面左侧 1/3 是「文章」轮廓——长条形纸张上写满文字(用乱码符号代替)。 > 画面右侧 2/3 是「配图阵列」——5 张缩略图横向排列,每张图下方挂一个橙色标签,标签上写文章里的关键词。 > 小创站在「文章」和「配图阵列」中间,背对读者,一手指着右侧 5 张图。 > 蓝色批注:「1 篇 → 5 图」;红色批注:「每图 1 事」。 **小创动作**:背对读者、单手指向配图阵列。 **生成 prompt 关键参数**: - 比例:16:9 - 留白:≥40% - 角色:背对视角(首次测试背身动作) > **【图片占位 2】** article_to_5_illustrations_decomposition.png --- ### 实例 3:概念隐喻 — 「信任账户」 **文章主题**:「写公众号就是往信任账户里存钱」 **核心认知锚点**:信任不是讲道理讲出来的,是一笔一笔存出来的。可以借(透支信任)但必须还(持续输出)。 **结构选择**:概念隐喻 **画面描述**: > 画面中央是一个透明玻璃罐子,罐子外形像存钱罐,顶部是一个漏斗口。罐子里堆着大量「硬币」——硬币上写「干货」「真实」「踩坑」等词。 > 罐子前方蹲着一个小创,单手把硬币从漏斗口投进罐子。 > 罐子底部有一行橙色字:「信任账户」。 > 红色批注:「存进去的是信用」;蓝色批注:「透支要还」。 **小创动作**:蹲姿、单手投币、专注。 **生成 prompt 关键参数**: - 比例:16:9 - 视觉焦点:玻璃罐(透明质感 + 笔触清爽) - 角色:蹲姿(首次测试非站立姿势) > **【图片占位 3】** trust_account_metaphor.png --- ### 实例 4:前后对比 — 「AI 配图」vs「Skill 配图」 **文章主题**:「为什么你的 AI 配图风格老崩」 **核心认知锚点**:通用 prompt 画的 5 张图,5 种画风;xiaohei Skill 画的 5 张图,1 种画风(5 个不同动作)。 **结构选择**:前后对比 **画面描述**: > 画面左右对称分两栏。 > 左栏标题:「直接 prompt」——5 个形态各异的小卡通人(有的胖、有的瘦、有的萌、有的丑)杂乱排列,每人身上有不同风格的衣服。底部红色字:「5 张图 / 5 张脸」。 > 右栏标题:「xiaohei Skill」——5 个一模一样的小创,但每个做不同动作(推眼镜、趴桌、举拇指、摸下巴、叉腰)。底部绿色字:「5 张图 / 1 个 IP」。 > 中间用一条红色虚线分隔。 **小创动作**:左右各 5 个(10 个小创)。 **生成 prompt 关键参数**: - 比例:16:9 - 角色重复:10 次(测试角色一致性) - 强调:左右 5 个小创的「一致性」对比 > **【图片占位 4】** before_after_ai_skill_comparison.png --- ### 实例 5:小漫画分镜 — 「AI 配图 3 件套」使用流程 **文章主题**:「公众号配图工具的 3 件套」 **核心认知锚点**:用 AI 给公众号配图,只需 3 步——选 Skill、换 IP、跑流程。 **结构选择**:小漫画分镜(3 格) **画面描述**: > 画面是横排 3 格漫画,从左到右: > **第 1 格**:小创站在 GitHub 仓库前,仓库外形是一个方块,上面写着「ian-xiaohei-illustrations」。小创单手指向仓库。蓝色字:「第 1 步:装 Skill」。 > **第 2 格**:小创坐在电脑前,屏幕显示 markdown 文档(`xiaohei-ip.md`),小创单手敲键盘。红色字:「第 2 步:换 IP」。 > **第 3 格**:小创站在一个「流水线」出口处,传送带运出 3 张配图,小创叉腰得意。绿色字:「第 3 步:跑流程」。 > 3 格之间用细黑线分隔,下方是统一标题「公众号配图 3 件套」。 **小创动作**:3 个不同姿态(指仓库、敲键盘、叉腰)。 **生成 prompt 关键参数**: - 比例:16:9 - 分镜:3 等分横排 - 角色:3 个不同姿态(测试多动作一致性) > **【图片占位 5】** comic_strip_3_step_workflow.png --- ## 第三步:白嫖的 2 个关键点 跑完 5 张图我总结了下,要真正白嫖到稳定效果,**有 2 个关键点**: **1. 准备一张参考图锁定角色 IP** 不准备参考图,AI 每次对小创的文字理解都有偏差(虽然 Skill 把角色定义写得很细,但图模型对「黑色短发少年 + 米色卫衣」的理解每次都差一点点)。**给一张小创的参考图用 img2img 锁形象**,所有图角色识别度从 60% → 95%。 ```python extra_body = { "image": ["data:image/png;base64,..."], # 小创参考图 "response_format": "b64_json" } ``` **2. 第一次跑用小尺寸(512×512)测 API** 1920×1080 大图生成要 2-3 分钟,**第一次调 API 容易超时**。先用 512×512 跑一次确认 API 通了、IP 形象对了,再切大图出最终版。 ## 免费 vs 付费:怎么选 **白嫖版(Agnes Image 2.1 Flash)能做什么**: - 风格一致的角色 IP 配图 - 5-10 张/天的批量配图 - 公众号正文插图、个人博客图、知识付费课程图 - 质量和 Midjourney V6 接近 70-80%,但风格 DNA 一致性比 MJ 还稳 **付费模型(OpenAI DALL-E / Midjourney / SDXL)** 适合: - 商业级海报、品牌 KV - 复杂多人场景、电影质感 - 中文标注准确度要求极高(生图模型对中文一直是老大难) **我的建议**:先用白嫖版跑通整个流程,验证 Skill 的设计是不是你需要的。**有预算了再换付费模型**。Skill 本身(规则文件)不变,只是换了一个生图后端。 ## 适合谁 - **写公众号 / 博客**,需要稳定配图风格的人 - **知识型内容创作者**(方法论、流程、概念解释) - **用 AI Agent 做内容生产**,希望视觉风格资产化的人 - **一人公司 / 小团队**——一个人也能产出统一风格的内容 - **预算有限的学生 / 独立开发者**——这套方案几乎不花钱 ## 不适合谁 - 要商业插画 / 品牌 KV / 精致扁平插画 - 要儿童卡通 / 可爱 IP / 表情包风格 - 要在一张图里塞大量文字 - 需要可编辑矢量源文件 ## 最后 这套方案的核心价值不是「白嫖」,是**「稳定地生同一种风格的图」**。单张图质量不是关键,关键是你能连续产 50 张图都看起来像一个人画的。 Agnes 模型目前没看到限量通知,**注册就能用**,先到先得白嫖窗口。 去 `https://agnes-ai.com` 注册 → 装 xiaohei Skill → 改 IP → 跑流程——30 分钟出第一张图,2 小时出第一篇配图齐的公众号文章。
摘要
标签
多个标签用逗号分隔
分类
技术文章
教程指南
工具测评
项目实战
行业观察
默认
💾 保存修改
← 返回查看
返回列表