编辑文档 - OpenSquilla 0.4.1：5k Stars 的"节流"Agent，把同一道题压到 $0.7（Windows 实测版）

标题

工具栏

点击或拖拽上传图片

支持 PNG, JPG, GIF, WebP 格式

内容 (Markdown 格式)

## OpenSquilla 0.4.1：5k Stars 的"节流"Agent，把同一道题压到 $0.7

我先是被它那个名字勾过来的——**OpenSquilla**。查了下，squilla 在西语里是"小龙虾"（属名 *Squilla mantis*），一种贴地爬但极其警觉的小东西。

这名字挺贴这项目的：贴地（local-first，路由器跑在设备上）、警觉（每个回合都打分，看值不值用大模型）。

仓库：https://github.com/opensquilla/opensquilla

> Apache-2.0 / Python 3.12+ / 5,051 Stars / 365 Forks / 90 Open Issues / 上次提交 2026-06-29

---

## 我第一眼看到的"怪词"

打开 README 没多久就撞到几个词，我愣了好几下：

- **SquillaRouter** —— 路由器，但不是网络路由器，是"模型路由器"
- **Tier 0/1/2/3** —— 难度分级，从 T0 到 T3
- **C0–C3** —— T0–T3 的别名，文档说"legacy name"
- **P0** —— prompt 策略
- **PinchBench 1.2.1** —— 它自带的基准

最离谱的是 Benchmark 表里，OpenSquilla 用路由器（Opus4.7 + GLM5.1 + DS4 Flash 混编）跑出来 **0.9251 分**，而 OpenClaw 跑单一 Opus 4.7 是 0.9255 分。**几乎一样的分数，成本从 $6.233 砍到 $0.688**。

$6.2 → $0.7，省了 89%。

这是它最想告诉你的卖点：**Same budget, more capability, better results**。

---

## Windows 装一下看看

我用的是 Windows 11，README 给的五条安装路径我挑了最稳的一条：Quick terminal install。

```powershell
powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
$env:Path = "$env:USERPROFILE\.local\bin;" + $env:Path

uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.4.1/opensquilla-0.4.1-py3-none-any.whl"
```

- 47.5 MB 的 wheel，下了 1 分多钟
- 默认装 SquillaRouter 配套（ONNX Runtime、LightGBM、NumPy、tokenizers）
- **Windows 注意事项**：Visual C++ Redistributable 2015–2022（x64）必须先装好，不然 ONNX 跑不起来。我的机器已经装过，没出问题
- 装好之后 `opensquilla --help` 直接出面板，工具齐全

它顺手在我 `C:\Users\Administrator\.opensquilla\workspace\` 下生成了 8 个文件：

```
AGENTS.md  BOOTSTRAP.md  HEARTBEAT.md  IDENTITY.md
MEMORY.md  SOUL.md       TOOLS.md      USER.md
memory\                   .opensquilla\
```

**这跟 OpenClaw / Hermes Agent 是一脉相承的"人格 + 记忆"分层**——`SOUL.md` 是语气，`USER.md` 是用户画像，`MEMORY.md` 是长期记忆，`HEARTBEAT.md` 是心跳节奏。首次跑会创建，后面跑不再覆盖。

---

## 跑 `doctor` 看出厂状态

```powershell
opensquilla doctor
```

输出挺干净的表格，分三栏：严重度 / 影响面 / 修复步骤。

我刚装完没配 provider，doctor 给我两条 error：

| 严重度 | 影响 | 修复 |
|--------|------|------|
| error | config | 跑 `opensquilla configure provider` |
| error | gateway | 跑 `opensquilla gateway start` |

有 error 就**给具体命令**，不是给一段散文让你自己琢磨。

> **小坑**：doctor 默认连 18791 端口，但如果你跟我一样用 `--port 18792` 起了 gateway，doctor 一开始会报"无法连接"。需要加 `--gateway ws://localhost:18792/ws` 参数才能指向自定义端口。**这意味着你最好别改端口**，跟着默认走省事。

---

## 路由器是怎么省 token 的

这部分是它最想让你理解的核心。我直接说大白话：

**SquillaRouter 是个 76MB 的 LightGBM + ONNX 分类器，本地跑在 ONNX Runtime 上**。

我装完看了一眼 `Lib\site-packages\opensquilla\squilla_router\models\v4.2_phase3_inference\`：

```
lgbm_main.bin      39.6 MB   主 LightGBM 模型
lgbm_aux.bin        3.4 MB   辅助 head
bge_onnx\model.onnx 23.9 MB  BGE 中文向量模型
```

每句话进来，它做几件事：

1. **看长度**——12 个字 vs 1200 字，权重不一样
2. **看语言**——中英日法德西六种，按 T0–T3 算分
3. **看是不是代码**——带 `def`、`import`、`#include` 这种
4. **看关键词**——"高风险"、"debug"、"长上下文" 等触发
5. **看 BGE 嵌入**——BGE-ONNX 模型（24MB）做语义特征

输出是一个 4 维的概率向量（4 个 tier），按概率定 T0–T3。

然后路由到不同模型。我从 `~/.opensquilla\config.toml` 扒出了默认的 tier 模型分配：

```text
C0 → deepseek/deepseek-v4-flash   快速、低风险、简单问答
C1 → deepseek/deepseek-v4-pro     默认、平衡、普通任务
C2 → z-ai/glm-5.2                 多步 coding、结构化推理
C3 → anthropic/claude-opus-4.8    最强、难规划、深审
image_model → moonshotai/kimi-k2.6  图片理解、视觉问答
```

**4 个 tier 全部用 OpenRouter**，所以配一次 key 就行。**思考等级全是 `high`**——OpenSquilla 默认让模型开深思考，不偷懒。

中间档按 P0/P1/P2 切换系统 prompt 长度和"思考时间"。**P0 的中文 hint 我从源码里挖出来了**：

```text
直接作答，缩短思考长度，避免无关展开。
```

这就是 P0 策略触发时给模型的指令——**别废话，直给答案**。P1/P2 我没去挖，估计是中等和详细。

我看到 README 里的数据很保守：

> Benchmark: 25 tasks，平均 OpenSquilla = 0.9251 / OpenClaw = 0.9255；token 1,721,328 vs 3,066,243；成本 $0.688 vs $6.233

token 直接省 44%，钱省 89%，分几乎一样。

**反过来说**：如果你每次都让 Opus 4.8 直接上场，OpenSquilla 给你退一步——简单问题交给便宜模型，难问题才丢给贵的。

---

## 装了 141 个 Skill，但只在用的时候加载

我跑了 `opensquilla skills list`，**总共 141 个 skill**，分两层：

- **bundled（50 个）**——代码、cron、github、memory、html-coder、pdf 等等
- **personal（91 个）**——从你机器上读出来的，OpenSquilla 不负责这些

bundled 里挑几个我眼熟的：

- `code-task` —— 跑真实仓库任务
- `deep-research` —— 多轮研究
- `meta-skill-creator` —— 创建新 skill
- `meta-short-drama` —— 短剧脚本（很野）
- `meta-paper-write` —— 论文写作
- `filesystem` / `git-diff` / `http-fetch` / `html-coder` —— 基础工具

我去 `Lib\site-packages\opensquilla\skills\bundled\` 数了一遍，**实际 67 个目录**（CLI 列表显示 50 是因为有些是嵌套）。挑 5 个我没想到的：

- `AwesomeWebpageMetaSkill` —— 主题建本地多媒体网页
- `nano-banana-pro` / `nano-banana-pro-openrouter` —— 图像生成
- `openrouter-video-generator` —— 视频生成
- `srt-from-script` —— 脚本生字幕
- `stack-trace-generic-probe` / `stack-trace-go-probe` / `stack-trace-js-probe` —— 堆栈跟踪探针（三个语言各一）

**关键设计**：**按需加载**。不是 141 个全塞 prompt，而是 LLM 说"我要用 github"才把 github skill 拉进去。这是 token 省的第二个关键。

`config.toml` 里有一行值得注意：

```toml
[skills]
max_skills_prompt_chars = 8000
filter_enabled = false
```

默认 prompt 注入的 skill 描述总长上限 **8000 字符**。`filter_enabled = false` 意味着默认全列，但 8000 字符把超出的自动截掉。

---

## 20+ LLM Provider，但有一半是 disabled

`opensquilla providers list` 列了 30 个：

- **13 个 supported**：openrouter / openai / anthropic / deepseek / gemini / groq / ollama / dashscope / moonshot / byteplus / qianfan / zhipu / siliconflow
- **17 个 disabled**：azure / lm_studio / minimax / mistral / ovms 等——README 说"待启用"

国内能用且 supported 的：**DeepSeek、阿里 DashScope、月之暗面 Moonshot、字节 BytePlus Ark**。Anthropic、OpenAI、Gemini 也都行。**本地 Ollama 也在 supported 列表**。

实际配置时推荐走 OpenRouter——一个 key 通吃所有模型，路由器在上面自己挑。

---

## 6 个搜索源，duckduckgo 不需要 key

`opensquilla search list` 单独列了搜索 provider：

```text
bocha      Bocha              supported       BOCHA_SEARCH_API_KEY
brave      Brave Search       supported       BRAVE_SEARCH_API_KEY
duckduckgo DuckDuckGo         supported       -         ← 不要 key
exa        Exa                supported       EXA_API_KEY
perplexity Perplexity         disabled        PERPLEXITY_API_KEY
tavily     Tavily             supported       TAVILY_API_KEY
```

默认走 duckduckgo，**零配置直接能搜**。`opensquilla search query "OpenSquilla"` 走 gateway 跑诊断查询（前提是 gateway 起着）。

---

## 10 个 channel + 17 个内置 tool

`opensquilla dist` 输出：

```text
bundled_channels: dingtalk, discord, feishu, matrix, qq, slack, telegram, terminal, websocket, wecom
bundled_tools:   admin, agent, agents, code_exec, filesystem, git, media,
                 memory_tools, messaging, nodes, patch, session_search,
                 sessions, shell, skill_tools, web, web_fetch
```

**10 个聊天渠道**：飞书、钉钉、QQ、企业微信、Discord、Slack、Telegram、Matrix、Terminal、WebSocket——基本把国内外 IM 都覆盖了。

**17 个内置 tool**——文件、git、shell、web、记忆、session、skill 这些 agent 必备。

我用过的几个核心：

- `agent` —— 起 sub-agent
- `shell` —— 跑命令
- `patch` —— 改文件（不破坏式编辑）
- `web` / `web_fetch` —— 联网搜
- `memory_tools` —— 写记忆
- `messaging` —— 发消息到渠道

---

## Migration：从 OpenClaw / Hermes 直接搬

这一条我觉得最实用。**`opensquilla migrate openclaw --apply`** 能直接把你原来的 OpenClaw 配置、记忆、技能、频道配置整套搬过来。

```powershell
opensquilla migrate openclaw --json     # 先 dry-run 看报告
opensquilla migrate openclaw --apply    # 应用
opensquilla migrate hermes --json       # 也可以搬 Hermes
opensquilla migrate hermes --apply
```

`--json` 输出迁移报告，能看到要搬哪些文件、哪些会冲突、哪些能合并。

我没真的搬——我的 OpenClaw 数据是 2 个月的实验数据，已经乱了。但这条迁移路径的"野心"是清楚的：它想当你机器上所有 agent runtime 的统一收口。

---

## 启动 Gateway 看一眼

```powershell
opensquilla gateway start --bind localhost --port 18792
# 跑起来后看 /control/ Web UI
```

打开浏览器看 `http://127.0.0.1:18792/control/`，出来的是**六语 Vue 控制台**——英文、简中、日文、法文、德文、西班牙文。

日志默认在 `~/.opensquilla\logs\` 路径，DEBUG 级别。跑起来的几行关键日志贴一下：

```
build_services.embedding_provider model=BAAI/bge-small-zh-v1.5 provider=local
build_services.search_provider_initialized provider=duckduckgo
build_services.skill_loader_initialized bundled_dir=.../skills/bundled
build_services.sandbox_ready backend=auto default_level=L1-standard
sandbox.disabled_insecure_mode: sandbox=false; host isolation is OFF
```

**最后这行是我最在意的**——sandbox 没起来。

---

## Windows 上的两个真坑

**坑 1：sandbox 后端在 Windows 上根本没有**

README 写得很明确：Linux 用 Bubblewrap，macOS 用 Seatbelt（目前只生成 profile，真正执行还没做），**Windows 上沙箱后端直接没有**。

这意味着 Windows 上跑 OpenSquilla 等于裸奔——它自己会 warning：

```
sandbox.disabled_insecure_mode: sandbox=false; host isolation is OFF
```

**安全敏感场景别在 Windows 跑**。要么 WSL2 要么 Mac 要么 Linux。我这次测试装在本机，全是只读操作，但要是真让 agent 跑 `shell`，那就是直接裸跑 PowerShell。

**坑 2：装好之后 router 跑不起来**

我装完 `opensquilla doctor --gateway ws://localhost:18792/ws` 报两个 error：provider 没配 + **V4 Phase 3 router did not become available: No module named 'numpy'**。

`recommended` 这个 extra 没把 numpy/lightgbm/onnxruntime 装全？我手装了一遍才解决：

```powershell
uv pip install numpy lightgbm onnxruntime tokenizers joblib scikit-learn sqlite-vec
```

然后 gateway 一重启，router 就起来了，doctor 少一个 error。

**这是 README 没写的坑**——`uv tool install [recommended]` 在 Windows 上不一定把 optional 依赖带全，**装好先跑一次 doctor**，看到 router 报错就手装。

---

## 适合谁

**适合**：
- 已经在用 OpenRouter 或者本地 Ollama，每次让 Opus 4.8 上场觉得太贵的
- OpenClaw / Hermes 重度用户，想找个能迁过去的
- 经常跑 cron 任务的（cron 时区精确、跨时区、自带失败重投）
- 想要 Web UI + 终端 + 飞书三端共用一个 agent

**不适合**：
- 只要一次性聊两句的——杀鸡用牛刀
- 安全敏感场景（Windows 上没沙箱，Mac 也只是部分）
- 还在用单一 provider 锁死的（你享受不到 router 的优势）

---

## 我的使用建议（Windows 视角）

1. **第一步先 `doctor` 看清自己的环境**——provider / gateway / 频道状态一目了然
2. **不要一上来就 chat**——`onboard` 走完再跑
3. **装完先 `doctor` 一次看 router 是否起来**——`recommended` extra 在 Windows 上偶尔漏 numpy/lightgbm
4. **别改默认端口 18791**——很多子命令硬编码这个，改了之后 `doctor` 找不到 gateway
5. **路由器默认配置即可**——76MB 的 LightGBM 模型装的时候随包带了，不要再去手动开
6. **生产环境上 Linux 或 WSL2**——Windows 上 sandbox 暂时是空的

---

**互动问题**：你每个月在 LLM API 上花多少钱？如果减到 1/10 你会想试试看吗？

小创 / 创见 AI 实验室

> 预加载评论
> 路由器这个思路是对的——简单问题没必要烧 Opus，OpenClaw 一刀切确实浪费 | 89% 成本削减、分数不掉，这个数据很猛，期待看更多 benchmark | Windows 上 sandbox 直接没有这个太关键了，生产环境千万别在 Windows 跑 | uv tool install [recommended] 居然漏 numpy，这 install 路径有 bug | 76MB 的路由器装在本机，听着有点重，但省 89% 钱还是值的 | 名字叫 Squilla（小龙虾）很可爱，logo 不知道长啥样

摘要

标签多个标签用逗号分隔

分类