📄 文档列表
🎬 口播文案
✏️ 编辑文档
标题
工具栏
加粗
H2 标题
H3 标题
引用
无序列表
有序列表
代码块
📷 上传图片
点击或拖拽上传图片
支持 PNG, JPG, GIF, WebP 格式
内容 (Markdown 格式)
 一部分人看 AI 相关的文章,总会被一堆缩写和概念绕晕。LLM、Agent、Skill、MCP、Harness……明明每个字都认识,但连在一起就不知道在说啥了。 这篇文章就干一件事:**把这些术语用大白话解释清楚,让你看完能跟人聊 AI 不露怯。** 分为两部分:第一部分是基础必修词,第二部分是 2026 年的高频新词。 --- ## 一、基础必修词 ### LLM:大模型,AI 的"大脑" LLM = **Large Language Model**,大语言模型。 你可以把它理解成 AI 的"大脑"。它被喂了海量的文本数据,学会了预测下一个词该怎么接——你输入一段文字,它来续写下文。 GPT-4、DeepSeek-V3、Qwen、Claude、Gemini……这些都是 LLM,只是公司不同、技术实现不同。 关键点:**LLM 本身只会"说话",它不知道你在哪个城市、你的项目用什么框架,它只认你喂给它的上下文。** ### Agent:能干活、会上瘾的 AI Agent(智能体)= LLM + 工具 + 记忆 + 自主决策。 如果说 LLM 是个只会答题的学生,Agent 就是不仅能答题、还能自己查资料、自己写代码跑测试、自己汇报结果的"实习生"。 它能干这些事: - **用工具**:调用搜索、读写文件、执行代码、浏览网页 - **记事情**:把对话中的关键信息存下来,下次接着用 - **做计划**:把一个复杂任务拆成几步,一步步执行 - **有反馈**:根据执行结果调整下一步行动 常见 Agent 框架:OpenClaw、Hermes、AutoGPT、CrewAI。 ### MCP:让 AI 跟外部工具"对上话"的协议 MCP = **Model Context Protocol**,模型上下文协议。 这是 Anthropic 在 2024 年底开源的一个标准协议,用来解决一个很实际的问题:**每个 AI 工具的接口都不一样,开发者每接一个新工具就得重写一遍。** MCP 就像 USB 接口——不管你用 U 盘还是移动硬盘,USB 口都通用。MCP 也一样:只要一个工具支持 MCP 协议,接入任何 Agent 框架的成本就大幅降低了。 举几个例子:你的 Agent 可以通过 MCP 直接调 Figma、GitHub、Slack、数据库——不需要为每个服务写单独的适配代码。 > 简单理解:**MCP = AI 工具的"万能转换头"。** ### Skill:把经验封装成可复用的模块 Skill(技能)是 AI 圈这两年最火的概念之一。 你可以把它理解成**一段封装好的经验或工作流**——不是让 AI 每次都从零摸索,而是把"怎么做这件事"的步骤固化下来,让它可以复用。 举例:你可以写一个 `review-code` Skill,规定 AI 每次做代码审查时必须检查:安全性、可读性、测试覆盖。写一个 `write-readme` Skill,规定输出格式必须是:功能概览 → 安装步骤 → 使用示例。 在 Claude Code、Cursor 等工具里,Skill 就是 `.md` 文件,写明触发条件、执行步骤、输出格式,Agent 遇到对应场景会自动调用。 ### Harness:测试 LLM 能力的"考试系统" Harness(测试框架)是用来系统化评估 LLM / Agent 表现的工具。 最知名的是 **LM Evaluation Harness**(简称 lm-eval),由 EleutherAI 开发,专门用来跑标准化的 LLM 评测任务——数学、代码、推理、常识,几十个 benchmark 统一测一遍,输出分数。 Agent 领域也有自己的 Harness,用来模拟真实任务场景、测量 Agent 的成功率、Token 消耗、执行时间。 > 简单理解:**Harness = 给 AI 出题、打分、排名的一套系统。** --- ## 二、2026 年常见高频词 下面这些词在 2026 年的 AI 社区出现频率极高,有些是功能增强,有些是架构演进。 ### Memory Provider / Agent Memory **Memory Provider** = Agent 的记忆 provider。它定义 Agent 如何存取、检索、遗忘历史信息。 之前那篇介绍 TencentDB Agent Memory 的文章讲过,OpenClaw 用 Memory Provider 机制把记忆系统做成了可插拔模块——换记忆方案不需要改 Agent 代码,只要换 provider。 **相关词:Context Window(上下文窗口)** LLM 一次能"记住"多少内容,取决于它的上下文窗口大小。GPT-4 Turbo 128k tokens,DeepSeek-V3 128k,Claude 3.5 200k——数字越大,Agent 能处理的任务就越长。 ### RAG + Vector Database **RAG** = **Retrieval-Augmented Generation**,检索增强生成。 简单说就是:LLM 回答问题之前,先去查一下"资料库"再回答,而不是纯靠内部知识瞎编。 **Vector Database(向量数据库)**是 RAG 的基础设施。文本被转成一串数字向量,语义相近的内容在向量空间里距离近,搜索时通过向量相似度匹配来召回相关内容。 代表工具:Chroma、Milvus、Qdrant、Pinecone、Weaviate。 ### Tool Calling / Function Calling **Tool Calling(工具调用)** = LLM 能主动调用外部工具(搜索、数据库、API)。 Function Calling 是 OpenAI 的叫法,本质一样:让 LLM 生成的输出不只是文字,而是一个"调用 XX 工具,参数是 YY"的指令。 这是 Agent 能够"行动"的技术基础——LLM 不是只输出文字,而是生成结构化的工具调用请求。 ### Multi-Agent **Multi-Agent(多智能体)** = 多个 Agent 协作完成复杂任务。 一个 Agent 专管搜索,一个专管代码审查,一个专管写报告——它们之间通过消息传递共享进度和结果,比单个 Agent 干所有事效率高得多。 代表框架:CrewAI(角色扮演式多 Agent)、Ruflo(自主 swarm 编排)。 ### Fine-tuning / LoRA **Fine-tuning(微调)** = 在已有的 LLM 基础上,用特定领域的数据再训练,让模型在某个方向上表现更好。 **LoRA(Low-Rank Adaptation)** 是一种高效微调技术——不重训练整个模型,只训练一小部分参数,大幅降低微调成本。 ### System Prompt **System Prompt(系统提示词)** = 跟 LLM 对话前,先输进去的一段"角色设定"。 比如你告诉它"你是一个资深后端工程师,善于发现代码安全隐患"——这是 System Prompt 的范畴,决定了 AI 的"人设"和基本行为模式。 ### Embedding **Embedding(嵌入)** = 把文字转成一串数字向量的技术。 "北京"和"上海"的 Embedding 向量距离近,说明它们语义相近;"北京"和"凉爽"距离远,说明语义不相关。 它是 RAG 和向量搜索的核心——所有文本都要先 Embedding,才能在向量数据库里检索。 ### Tokens **Token** = LLM 处理文本的最小单位。 不是按字数算,是按 token 算。英文里一个词大约 1-2 个 token,中文一个字大约 1 个 token。API 收费也是按输入 + 输出的 token 总数计的。 Context Window 的限制本质就是 token 数量的限制。 ### Temperature / Top-p **Temperature(温度)** = 控制 LLM 输出随机性的参数。 - `Temperature = 0`:每次输出几乎一样,适合精确任务(代码、翻译) - `Temperature = 1.0`:正常随机性,创意写作 - `Temperature 更高`:更跳跃、更随机,可能天马行空 **Top-p** 是另一种采样策略,控制模型只在概率最高的那部分 token 里做选择。 --- ## 三、一张图看清它们的关系 ``` ┌──────────┐ │ LLM │ ← 大脑,会说话但不会行动 └────┬─────┘ │ + 工具 + 记忆 + 决策 ▼ ┌──────────┐ │ Agent │ ← 能干活、能自主行动 └────┬─────┘ │ 插拔式记忆方案 ▼ ┌──────────────┐ │Memory Provider│ └──────┬───────┘ │ 用 MCP 协议对接外部工具 ▼ ┌──────────┐ │ MCP │ ← 工具的"万能转换头" └────┬─────┘ │ 调 Figma / GitHub / 数据库… ▼ ┌──────────┐ │ 工具们 │ └──────────┘ ``` - **LLM** 提供推理能力 - **Agent** 在 LLM 基础上加上了行动力 - **MCP** 让 Agent 能统一调用各种工具 - **Skill** 把经验封装成可复用的模板 - **Harness** 用来测试这些系统到底好不好用 --- ## 四、这些词经常被混用,澄清一下 社区里经常看到把 Agent 和 LLM 混着说的情况,简单区分一下: | 说法 | 实际指什么 | |:---|:---| | "这个 Agent 很强" | 通常指 LLM 基座强 + 工具链配得好 | | "换了个 LLM,效果好了很多" | 基座模型换了,Agent 框架没变 | | "接入了 MCP 能力" | 工具接入层换了,LLM 没换 | | "写了个 Skill" | 经验被模板化了,Agent 调用更稳定 | --- ## 写在最后 AI 圈的黑话很多,但大多数概念都是为了解决具体问题才出现的。 搞清楚每个词的来龙去脉,比硬背定义有用得多——你不需要成为术语专家,但得知道它们解决的是哪类问题。 **你觉得哪个概念最难跟外行人解释清楚?评论区说说。** ---
摘要
标签
多个标签用逗号分隔
分类
技术文章
教程指南
工具测评
项目实战
行业观察
默认
💾 保存修改
← 返回查看
返回列表