爱奇艺pps影音通用版
98.3MB · 2025-10-28
最近 AI 圈最火的词非 MCP(Model Context Protocol) 莫属。
GitHub 上的 Star 数一路飙升,推特上各种开发者晒截图炫技:“我的 Agent 能调用浏览器了”“我让模型自己调了自己写的 API!”
小dora 也按捺不住好奇心,泡在文档里翻了几天。
看着 MCP 一步步让 AI 从“能聊天”进化到“能协作”,
脑子里闪过一个念头:
于是这篇笔记就诞生了。
我们不止聊现象,更聊背后的逻辑——
AI 为什么要这么设计,它在“进化”的过程中,究竟补上了哪些“人类式能力”。
当初 ChatGPT 问世那会儿,全世界的开发者都震惊了。
一个模型,能写诗、能改代码、能分析论文。
一时间仿佛智商都被它碾压。
可很快大家发现了问题:
它说得头头是道,却不一定靠谱。
你问它数据库的 schema,它编;
你问它接口返回结构,它猜。
背后的原因其实很简单:
LLM 的本质是一个 超大规模语言概率模型。
它只是在统计意义上预测下一个 token 的可能性。
所谓“智能”,只是统计规律的语言幻觉。
它擅长“生成”,但不擅长“操作”;
它理解“语言”,却不了解“世界”。
换句话说:
LLM 能做到这一步,靠的是 Transformer 架构带来的上下文建模能力。
它的 self-attention 机制让模型在每次生成时都能回顾全局——这赋予了“上下文理解”的错觉。
但错觉终究是错觉:
Transformer 只能“记得”输入的内容,却不“知道”它意味着什么。
它能生成 SQL,但不能执行 SQL。
它能说“地球绕太阳转”,但它并不知道太阳系是什么。
AI 想要更进一步,就必须打破“语言沙盒”,
去真正调用外部系统。
于是 OpenAI 在 2023 年推出了 Function Calling。
这一步的意义,就像人类从“发明语言”进化到“发明工具”。
开发者可以预定义函数描述,比如:
{
"name": "search_user",
"description": "根据用户名查询数据库用户",
"parameters": {
"type": "object",
"properties": {
"username": { "type": "string" }
},
"required": ["username"]
}
}
然后模型理解你的意图,自动返回一个结构化调用:
{ "name": "search_user", "arguments": { "username": "小吴" } }
模型的回答不再是“我猜他在数据库里”,
而是“我可以调用这个接口去查一下”。
——它终于学会“动手”了。
Function Calling 本质上是给 LLM 加了一个“结构化 I/O 层”。
它不再用自然语言糊你一脸,而是以 JSON 的方式表达决策。
这背后其实是一次范式转变:
以前模型说“帮我查下天气”,你得靠 prompt 模板来引导它输出。
现在它能准确地生成:
{ "name": "get_weather", "arguments": { "city": "杭州" } }
这种结构化输出让模型第一次具备了可编排性,
也让我们能安全地将 LLM 接入生产系统。
Function Calling 的局限性很明显:
换句话说:
它会用工具,但不知道何时用、为什么用、和谁配合用。
终于,2024 年末,OpenAI 推出了 MCP(Model Context Protocol) 。
这个词听起来有点抽象,但本质上它是一个“AI 的操作系统级协议”。
你可以这么理解:
MCP 的目标是建立一个 标准化的上下文通信协议。
这意味着模型不再依赖单一接口,而是能:
举个例子,未来可能是这样的:
这一步的意义堪比从单机操作系统到互联网时代的跃迁。
MCP 的设计由三层组成:
| 层级 | 说明 | 类比 |
|---|---|---|
| Model Client | AI模型或智能体 | 使用者(大脑) |
| Model Context Server | 负责上下文管理与指令中转 | 操作系统内核 |
| Tools / Resources | 外部API、文件系统、数据库等 | 工具与外设 |
通信过程采用 双向流式上下文传递,
模型不仅能发起请求,还能接收外部状态变化。
这意味着:
LLM 的未来形态,不再是 “Large Language Model”,
而是 “Large Life Model”——
一个能理解环境、能主动决策、能协作执行的“数字生物”。
MCP 的出现,是语言智能走向行动智能的里程碑。
它将 Function Calling 的点状调用,扩展为“语境图谱”;
将单智能体的任务执行,扩展为“群体智能协作”。
| 阶段 | 关键词 | 核心突破 | 类比 |
|---|---|---|---|
| LLM | 语言觉醒 | 生成语言 | 婴儿学说话 |
| Function Calling | 工具觉醒 | 执行外部任务 | 青少年学干活 |
| MCP | 协作觉醒 | 理解上下文、共享环境 | 成年人懂配合 |
以前我们写代码,是人类告诉机器“怎么做”;
而现在,我们正在教机器“自己想办法做到”。
未来的编程形态可能是这样的:
我:帮我构建一个页面,可以上传文件并自动生成分析报告。
AI:好的,我会用 React + FastAPI 实现,预计 3 个模块。是否要我创建 repo 并初始化项目?
那一刻,程序员的角色将从“码农”变成“智能体指挥官”。
而编程,不再是堆砌逻辑,而是编排智能。
LLM 是语言的奇迹,
Function Calling 是行为的启蒙,
MCP 是协作的黎明。
它们共同构成了 AI 的进化三部曲——
从“理解人类”到“协作世界”。
或许再过几年,我们不会再说“AI 是工具”,
而会说:
2025-10-28
华为余承东:仅用 43 个月,鸿蒙智行全系交付突破 100 万台
2025-10-28
酷态科 10 号超级磁吸电能卡发布:TFT 彩屏、无线 15W / 有线 55W,10000mAh 售 199 元