📄 文档管理系统

← 返回列表

OpenSquilla 0.4.1:5k Stars 的"节流"Agent,把同一道题压到 $0.7(Windows 实测版)

default 📅 创建:2026-06-30 17:19:07 🔄 更新:2026-06-30 09:19:07
👁️ 预览 & 复制到公众号 ✏️ 编辑

OpenSquilla 0.4.1:5k Stars 的"节流"Agent,把同一道题压到 $0.7

我先是被它那个名字勾过来的——OpenSquilla。查了下,squilla 在西语里是"小龙虾"(属名 Squilla mantis),一种贴地爬但极其警觉的小东西。

这名字挺贴这项目的:贴地(local-first,路由器跑在设备上)、警觉(每个回合都打分,看值不值用大模型)。

仓库:https://github.com/opensquilla/opensquilla

Apache-2.0 / Python 3.12+ / 5,051 Stars / 365 Forks / 90 Open Issues / 上次提交 2026-06-29


我第一眼看到的"怪词"

打开 README 没多久就撞到几个词,我愣了好几下:

最离谱的是 Benchmark 表里,OpenSquilla 用路由器(Opus4.7 + GLM5.1 + DS4 Flash 混编)跑出来 0.9251 分,而 OpenClaw 跑单一 Opus 4.7 是 0.9255 分。几乎一样的分数,成本从 $6.233 砍到 $0.688

$6.2 → $0.7,省了 89%。

这是它最想告诉你的卖点:Same budget, more capability, better results


Windows 装一下看看

我用的是 Windows 11,README 给的五条安装路径我挑了最稳的一条:Quick terminal install。

powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
$env:Path = "$env:USERPROFILE\.local\bin;" + $env:Path

uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.4.1/opensquilla-0.4.1-py3-none-any.whl"

它顺手在我 C:\Users\Administrator\.opensquilla\workspace\ 下生成了 8 个文件:

AGENTS.md  BOOTSTRAP.md  HEARTBEAT.md  IDENTITY.md
MEMORY.md  SOUL.md       TOOLS.md      USER.md
memory\                   .opensquilla\

这跟 OpenClaw / Hermes Agent 是一脉相承的"人格 + 记忆"分层——SOUL.md 是语气,USER.md 是用户画像,MEMORY.md 是长期记忆,HEARTBEAT.md 是心跳节奏。首次跑会创建,后面跑不再覆盖。


doctor 看出厂状态

opensquilla doctor

输出挺干净的表格,分三栏:严重度 / 影响面 / 修复步骤。

我刚装完没配 provider,doctor 给我两条 error:

严重度 影响 修复
error config opensquilla configure provider
error gateway opensquilla gateway start

有 error 就给具体命令,不是给一段散文让你自己琢磨。

小坑:doctor 默认连 18791 端口,但如果你跟我一样用 --port 18792 起了 gateway,doctor 一开始会报"无法连接"。需要加 --gateway ws://localhost:18792/ws 参数才能指向自定义端口。这意味着你最好别改端口,跟着默认走省事。


路由器是怎么省 token 的

这部分是它最想让你理解的核心。我直接说大白话:

SquillaRouter 是个 76MB 的 LightGBM + ONNX 分类器,本地跑在 ONNX Runtime 上

我装完看了一眼 Lib\site-packages\opensquilla\squilla_router\models\v4.2_phase3_inference\

lgbm_main.bin      39.6 MB   主 LightGBM 模型
lgbm_aux.bin        3.4 MB   辅助 head
bge_onnx\model.onnx 23.9 MB  BGE 中文向量模型

每句话进来,它做几件事:

  1. 看长度——12 个字 vs 1200 字,权重不一样
  2. 看语言——中英日法德西六种,按 T0–T3 算分
  3. 看是不是代码——带 defimport#include 这种
  4. 看关键词——"高风险"、"debug"、"长上下文" 等触发
  5. 看 BGE 嵌入——BGE-ONNX 模型(24MB)做语义特征

输出是一个 4 维的概率向量(4 个 tier),按概率定 T0–T3。

然后路由到不同模型。我从 ~/.opensquilla\config.toml 扒出了默认的 tier 模型分配:

C0 → deepseek/deepseek-v4-flash   快速、低风险、简单问答
C1 → deepseek/deepseek-v4-pro     默认、平衡、普通任务
C2 → z-ai/glm-5.2                 多步 coding、结构化推理
C3 → anthropic/claude-opus-4.8    最强、难规划、深审
image_model → moonshotai/kimi-k2.6  图片理解、视觉问答

4 个 tier 全部用 OpenRouter,所以配一次 key 就行。思考等级全是 high——OpenSquilla 默认让模型开深思考,不偷懒。

中间档按 P0/P1/P2 切换系统 prompt 长度和"思考时间"。P0 的中文 hint 我从源码里挖出来了

直接作答,缩短思考长度,避免无关展开。

这就是 P0 策略触发时给模型的指令——别废话,直给答案。P1/P2 我没去挖,估计是中等和详细。

我看到 README 里的数据很保守:

Benchmark: 25 tasks,平均 OpenSquilla = 0.9251 / OpenClaw = 0.9255;token 1,721,328 vs 3,066,243;成本 $0.688 vs $6.233

token 直接省 44%,钱省 89%,分几乎一样。

反过来说:如果你每次都让 Opus 4.8 直接上场,OpenSquilla 给你退一步——简单问题交给便宜模型,难问题才丢给贵的。


装了 141 个 Skill,但只在用的时候加载

我跑了 opensquilla skills list总共 141 个 skill,分两层:

bundled 里挑几个我眼熟的:

我去 Lib\site-packages\opensquilla\skills\bundled\ 数了一遍,实际 67 个目录(CLI 列表显示 50 是因为有些是嵌套)。挑 5 个我没想到的:

关键设计按需加载。不是 141 个全塞 prompt,而是 LLM 说"我要用 github"才把 github skill 拉进去。这是 token 省的第二个关键。

config.toml 里有一行值得注意:

[skills]
max_skills_prompt_chars = 8000
filter_enabled = false

默认 prompt 注入的 skill 描述总长上限 8000 字符filter_enabled = false 意味着默认全列,但 8000 字符把超出的自动截掉。


20+ LLM Provider,但有一半是 disabled

opensquilla providers list 列了 30 个:

国内能用且 supported 的:DeepSeek、阿里 DashScope、月之暗面 Moonshot、字节 BytePlus Ark。Anthropic、OpenAI、Gemini 也都行。本地 Ollama 也在 supported 列表

实际配置时推荐走 OpenRouter——一个 key 通吃所有模型,路由器在上面自己挑。


6 个搜索源,duckduckgo 不需要 key

opensquilla search list 单独列了搜索 provider:

bocha      Bocha              supported       BOCHA_SEARCH_API_KEY
brave      Brave Search       supported       BRAVE_SEARCH_API_KEY
duckduckgo DuckDuckGo         supported       -         ← 不要 key
exa        Exa                supported       EXA_API_KEY
perplexity Perplexity         disabled        PERPLEXITY_API_KEY
tavily     Tavily             supported       TAVILY_API_KEY

默认走 duckduckgo,零配置直接能搜opensquilla search query "OpenSquilla" 走 gateway 跑诊断查询(前提是 gateway 起着)。


10 个 channel + 17 个内置 tool

opensquilla dist 输出:

bundled_channels: dingtalk, discord, feishu, matrix, qq, slack, telegram, terminal, websocket, wecom
bundled_tools:   admin, agent, agents, code_exec, filesystem, git, media,
                 memory_tools, messaging, nodes, patch, session_search,
                 sessions, shell, skill_tools, web, web_fetch

10 个聊天渠道:飞书、钉钉、QQ、企业微信、Discord、Slack、Telegram、Matrix、Terminal、WebSocket——基本把国内外 IM 都覆盖了。

17 个内置 tool——文件、git、shell、web、记忆、session、skill 这些 agent 必备。

我用过的几个核心:


Migration:从 OpenClaw / Hermes 直接搬

这一条我觉得最实用。opensquilla migrate openclaw --apply 能直接把你原来的 OpenClaw 配置、记忆、技能、频道配置整套搬过来。

opensquilla migrate openclaw --json     # 先 dry-run 看报告
opensquilla migrate openclaw --apply    # 应用
opensquilla migrate hermes --json       # 也可以搬 Hermes
opensquilla migrate hermes --apply

--json 输出迁移报告,能看到要搬哪些文件、哪些会冲突、哪些能合并。

我没真的搬——我的 OpenClaw 数据是 2 个月的实验数据,已经乱了。但这条迁移路径的"野心"是清楚的:它想当你机器上所有 agent runtime 的统一收口。


启动 Gateway 看一眼

opensquilla gateway start --bind localhost --port 18792
# 跑起来后看 /control/ Web UI

打开浏览器看 http://127.0.0.1:18792/control/,出来的是六语 Vue 控制台——英文、简中、日文、法文、德文、西班牙文。

日志默认在 ~/.opensquilla\logs\ 路径,DEBUG 级别。跑起来的几行关键日志贴一下:

build_services.embedding_provider model=BAAI/bge-small-zh-v1.5 provider=local
build_services.search_provider_initialized provider=duckduckgo
build_services.skill_loader_initialized bundled_dir=.../skills/bundled
build_services.sandbox_ready backend=auto default_level=L1-standard
sandbox.disabled_insecure_mode: sandbox=false; host isolation is OFF

最后这行是我最在意的——sandbox 没起来。


Windows 上的两个真坑

坑 1:sandbox 后端在 Windows 上根本没有

README 写得很明确:Linux 用 Bubblewrap,macOS 用 Seatbelt(目前只生成 profile,真正执行还没做),Windows 上沙箱后端直接没有

这意味着 Windows 上跑 OpenSquilla 等于裸奔——它自己会 warning:

sandbox.disabled_insecure_mode: sandbox=false; host isolation is OFF

安全敏感场景别在 Windows 跑。要么 WSL2 要么 Mac 要么 Linux。我这次测试装在本机,全是只读操作,但要是真让 agent 跑 shell,那就是直接裸跑 PowerShell。

坑 2:装好之后 router 跑不起来

我装完 opensquilla doctor --gateway ws://localhost:18792/ws 报两个 error:provider 没配 + V4 Phase 3 router did not become available: No module named 'numpy'

recommended 这个 extra 没把 numpy/lightgbm/onnxruntime 装全?我手装了一遍才解决:

uv pip install numpy lightgbm onnxruntime tokenizers joblib scikit-learn sqlite-vec

然后 gateway 一重启,router 就起来了,doctor 少一个 error。

这是 README 没写的坑——uv tool install [recommended] 在 Windows 上不一定把 optional 依赖带全,装好先跑一次 doctor,看到 router 报错就手装。


适合谁

适合
- 已经在用 OpenRouter 或者本地 Ollama,每次让 Opus 4.8 上场觉得太贵的
- OpenClaw / Hermes 重度用户,想找个能迁过去的
- 经常跑 cron 任务的(cron 时区精确、跨时区、自带失败重投)
- 想要 Web UI + 终端 + 飞书三端共用一个 agent

不适合
- 只要一次性聊两句的——杀鸡用牛刀
- 安全敏感场景(Windows 上没沙箱,Mac 也只是部分)
- 还在用单一 provider 锁死的(你享受不到 router 的优势)


我的使用建议(Windows 视角)

  1. 第一步先 doctor 看清自己的环境——provider / gateway / 频道状态一目了然
  2. 不要一上来就 chat——onboard 走完再跑
  3. 装完先 doctor 一次看 router 是否起来——recommended extra 在 Windows 上偶尔漏 numpy/lightgbm
  4. 别改默认端口 18791——很多子命令硬编码这个,改了之后 doctor 找不到 gateway
  5. 路由器默认配置即可——76MB 的 LightGBM 模型装的时候随包带了,不要再去手动开
  6. 生产环境上 Linux 或 WSL2——Windows 上 sandbox 暂时是空的

互动问题:你每个月在 LLM API 上花多少钱?如果减到 1/10 你会想试试看吗?

小创 / 创见 AI 实验室

预加载评论
路由器这个思路是对的——简单问题没必要烧 Opus,OpenClaw 一刀切确实浪费 | 89% 成本削减、分数不掉,这个数据很猛,期待看更多 benchmark | Windows 上 sandbox 直接没有这个太关键了,生产环境千万别在 Windows 跑 | uv tool install [recommended] 居然漏 numpy,这 install 路径有 bug | 76MB 的路由器装在本机,听着有点重,但省 89% 钱还是值的 | 名字叫 Squilla(小龙虾)很可爱,logo 不知道长啥样

💬 评论区

加载中...