来源:北大青鸟品牌推广部 2026年06月17日 16:35
AI的七层关系:从Token到Skills,全链路拆解剖析

[你给AI发了一句话,它到底是怎么一步步把活儿干完的?]
前几天和一个做产物的朋友聊天,他说团队每天都在用AI写文案、做总结、跑数据分析,但没人说得清AI内部到底是怎么运作的。“就知道往里面填提示词,出来的结果有时候好有时候差,跟开盲盒一样。”
这还真不是个例。GPT、Claude、文心一言、DeepSeek轮番上新,大家都在用AI,但真正理解它“怎么工作”的人,其实不多。
今天这篇文章,我把AI从“收到一句话”到“交出一份报告”的完整过程拆成七层,从下到上依次是:Token → 提示词 → 上下文 → Agent → Harness → MCP → Skills。
不需要技术背景,看完你就能跟别人讲清楚,AI到底是怎么把一句话变成一篇稿子的。
第一层:Token——文字的最小颗粒
你发给AI的每一句话,AI回复的每一个字,在底层都会被拆成一粒粒“Token”。
Token是大模型处理文字的最小单位。英文通常是一个单词或一个子词,中文通常是一个字或一个词。比如你输入“帮我做客户复盘”,AI会先把它拆成若干个Token碎片再处理。
为什么要拆?因为大模型不直接“读懂”文字,它读的是数字。每一个Token对应一个数字编号,模型靠这些编号来做推理。
Token直接决定了两件事:你花了多少钱(API按Token计费),以及模型能“记住”多少内容(上下文窗口有限)。这也是为什么你贴一份几十页的PDF进去,模型聊到后面会“忘记”前面的内容——上下文窗口装不下了。
第二层:提示词——你的口头吩咐
Token只是原材料,提示词(Prompt)才是你把意图传递给AI的方式。
提示词就是你给AI下达的指令,比如“帮我写一份市场分析报告”,是一切任务的起点。你描述得越清楚,AI干得越准。
举个例子:
·差的提示词:「写一篇文章」——AI根本不知道写什么、给谁看、什么风格
·好的提示词:「帮我写一篇给职场新人的公众号文章,主题是“如何高效使用AI工具”,1500字左右,语气亲切、有具体案例」——AI马上就能干活
提示词工程已经成为一门单独的技能。好的提示词通常包含角色、任务、约束、范例四个要素。不需要背模板,但需要养成“把需求说清楚”的习惯。
第叁层:上下文——AI的“工作备忘录”
上下文是AI在交互过程中“记住”的所有信息,包括当前的提示词、之前的对话历史、设定的角色规则等。
这也是为什么你在对话里前面说了“我叫小王”,后面再问“我是谁”,AI能答上来。
但上下文有叁个限制:
·容量有限:目前主流模型的上下文窗口在8K~128K Token不等,超出后最早的内容会被“挤出去”
·不是长期记忆:关掉对话再开,上下文就清空了
·越长越贵:上下文越长,消耗的Token越多,成本越高
可以把它理解成管家的“工作笔记本”,每一页都记着之前的对话,但笔记本页数有限,满了就会忘记最早的内容。
第四层:Agent——你的“数字大管家”
当模型不再只是单次回复,而是能根据任务自主规划步骤、决定调用什么工具时,它就升级成了Agent(智能体) 。
Agent就是你雇的“大管家”——它接下你的目标后,自己规划步骤、安排工作,不需要你每一步都指挥。
还是用“客户复盘”的例子:
·普通模型:你问一句,它答一句
·Agent:你告诉它“帮我做本周客户复盘”,它会自己规划——先查数据、再整理、再写总结、最后排版
Agent的核心价值在于自主性:它不再只是聊天,而是能把复杂任务拆解执行。
第五层:Harness——给管家定的“家规”
Harness是Agent的“运行环境”和“约束框架”。用大白话说,就是给管家定的家规。
一个裸模型本身并不是Agent。只有给它配上状态管理、工具执行、反馈循环和enforceable constraints(可执行的约束),它才成为一个真正的Agent。
Harness具体管什么?
·能做什么、不能做什么:权限控制,防止越界操作
·怎么循环执行:让Agent可以反思、重试、自我纠错
·怎么管理状态:跨会话的记忆、任务进度追踪
“Agent = 模型 + Harness”——没有Harness的模型只是一个会聊天的脑子,有了Harness才是一个能干活、守规矩的员工。
第六层:MCP——AI领域的“USB-C接口”
MCP(Model Context Protocol,模型上下文协议)是Anthropic推动的开放协议标准。通俗地说,它就是Agent与外部系统之间的“通用接口” 。
在没有MCP之前,AI每接入一个工具(Excel、CRM、网页搜索)都要单独写一套接口代码,非常碎片化。MCP统一了连接方式——就像USB-C统一了各种充电口一样。
Agent通过MCP可以:
·读取本地文件
·连接数据库
·调用API
·操作浏览器
·执行代码
还是“客户复盘”的例子:Agent通过MCP协议调用Excel拉取数据、连接CRM系统查客户信息、调用网页搜索补全行业动态。所有这些外部资源的调用,都通过MCP这个标准化接口完成。
第七层:Skills——管家的“手艺绝活”
Skills是AI最外层的“动手能力”——也就是Agent通过MCP实际调用的具体功能模块。
Agent Skills是一种模块化的能力封装,包含指令、脚本和资源,让智能体能够更准确、更高效地完成特定任务。
打个比方:
·传统方式:每次都要跟AI详细解释“怎么做”
·Skills方式:把“写周报”“做PPT”“数据分析”这些能力提前封装好,AI直接调用
在客户复盘的例子里,最终的输出——“一份完整、规范的客户复盘报告”——就是Skills层交付的成果。Skills把前面所有层的努力(Token拆解、提示词理解、上下文记忆、Agent规划、Harness约束、MCP数据拉取)转化成了实实在在的产出。
七层如何协同工作?
把这七层串起来,整个流程是这样的:
你说出需求 → 提示词传达指令 → 内容被拆成Token存入上下文 → Agent管家接收任务 → 在Harness家规约束下运行 → 通过MCP标准接口调用外部资源 → 调动自身Skills技能 → 完成任务交付结果
更直观地看,这七层可以分成叁个层次:
·底层(Token→提示词→上下文):解决“AI如何理解你”的问题
·中层(Agent→Harness):解决“AI如何按规则自主干活”的问题
·上层(MCP→Skills):解决“AI如何调用资源、解决具体问题”的问题
从Token到Skills,这条链路本质上定义了AI从“理解指令”到“落地执行”的完整闭环。下次你再跟AI对话的时候,不妨想想——你输入的每一个字,正在经历这七层旅程,最后变成你收到的那个答案。