回到顶部

阅读目录

一文了解 AI 大模型的 LLM、prompt、RAG、MCP、Agent、Skill、Rule、dify、ollama、open-webui、LangChain、OpenClaw、qoder、CodeBuddy 、trae、cursor 等

LLM 是 AI 能力的基础 “大脑”;
Prompt 是人与 LLM 交互的指令载体;
RAG 为 LLM 提供外部知识增强,减少 “幻觉”;
MCP 是 AI 与外部工具 / 数据的标准化连接协议。
Agent 是整合 LLM、RAG、MCP 等能力的自主决策实体;
Skill 是 Agent 的模块化能力包;
Rule 是约束 Agent 行为的规范体系。
difyLangChain 是 LLM 应用开发框架;
ollama 是本地 LLM 运行工具;
open-webui 是本地 LLM 的可视化前端;
OpenClaw 是个人电脑端 AI 代理。
阿里 Qoder、华为 CodeArts Doer、腾讯 CodeBuddy、字节 TraeCursor 等是面向开发场景的 AI 编程工具 / IDE,均深度集成上述技术栈。

一、核心技术概念解释

  1. 基础模型层

LLM (Large Language Model,大语言模型)

  • 定义:基于 Transformer 架构,通过海量文本数据训练的大规模语言模型,具备理解和生成人类语言的能力。

  • 类比:AI 系统的 “大脑内核”,提供基础的语言理解、推理和生成能力。

  • 代表:GPT-4、Claude 3、通义千问、混元大模型等。

  1. 交互与增强技术层

Prompt (提示词)

  • 定义:人类与 LLM 沟通的指令载体,以自然语言形式传递需求、背景和要求,引导模型输出符合预期的结果。

  • 类比:给 AI 助手的 “命令”,单次指令触发特定响应。

  • 进阶:提示工程 (Prompt Engineering) 通过优化指令格式提升模型表现。

RAG (Retrieval-Augmented Generation,检索增强生成)

  • 定义:将信息检索与文本生成相结合的技术框架,在 LLM 回答前先从外部知识库检索相关信息,作为上下文注入模型,提升回答准确性和时效性。

  • 类比:LLM 的 “外挂资料库”,解决知识截止和幻觉问题。

  • 流程:用户查询→关键词提取→向量数据库检索→相关文档→上下文注入→LLM 生成答案。

MCP (Model Context Protocol,模型上下文协议)

  • 定义:Anthropic 于 2024 年推出的开放协议,标准化 LLM 与外部数据源、工具的通信,实现安全高效的连接。

  • 类比:AI 系统的 “USB-C 接口”,统一不同工具和数据的接入方式。

  • 核心价值:打破数据孤岛,让 AI 安全调用本地文件、数据库、API 等外部资源。

  1. 智能体层

Agent (智能体)

  • 定义:能够感知环境、自主决策并执行行动以实现特定目标的 AI 实体,整合 LLM、RAG、MCP 等技术能力。

  • 类比:“全能数字员工”,可自主拆解任务、制定计划、调用工具完成复杂目标。

  • 核心能力:任务规划、工具调用、记忆管理、结果反思迭代。

Skill (技能)

  • 定义:为 Agent 提供的标准化、可复用、可扩展的能力集合,封装了特定任务的执行方法、工具调用逻辑和知识材料。

  • 类比:Agent 的 “手脚” 和 “经验库”,如 PDF 处理 Skill、代码生成 Skill 等。

  • 形式:通常包含 SKILL.md 文件,组织指令、脚本和参考资料。

Rule (规则)

  • 定义:约束 Agent 行为的规范体系,包括业务规则、安全规范、编码标准等,确保 Agent 输出符合预期和合规要求。

  • 类比:Agent 的 “行为准则”,如代码规范 Rule、数据访问权限 Rule 等。

二、工具与平台解释

  1. 开发与部署工具

工具名称 核心定位 特色功能 典型场景
dify 开源 LLM 应用开发平台 可视化 Prompt 编排、内置 RAG 引擎、Agent 工作流设计、多模型兼容、MCP 协议支持 快速构建 AI 应用、企业级 RAG 系统、智能体开发
ollama 本地 LLM 运行工具 一键运行主流开源模型 (Llama 3、Phi-3 等)、自动管理依赖、支持模型量化、保障数据隐私 离线环境 AI 助手、隐私敏感数据分析、本地模型测试
open-webui 本地 LLM 可视化前端 友好聊天界面、多模型管理、自定义提示词模板、API 集成 本地模型可视化交互、团队共享 LLM 访问
LangChain LLM 应用开发框架 链式调用、提示词管理、文档加载器、向量存储集成、Agent 开发工具 复杂 AI 应用开发、自定义 RAG 系统、多工具协同 Agent
OpenClaw 个人电脑 AI 代理 自主任务执行、MCP 协议集成、Skill 插件生态、本地设备控制 个人数字助理、文件管理、日程安排、自动化办公
  1. AI 编程工具 / IDE

工具名称 开发者 核心定位 特色功能
阿里 Qoder 阿里巴巴 Agentic 编程平台 Quest Mode 任务委托、多模型动态调度、代码检索引擎、长短期记忆系统
华为 CodeArts Doer 华为 全流程 AI 编程助手 6 大专业 Agent (团队、产品、开发等)、分级记忆机制、探索 / 规范双模式
腾讯 CodeBuddy IDE 腾讯 全栈协作 AI IDE Craft 智能体、自然语言转 PRD、设计稿转代码、混元 + DeepSeek 双模型
字节跳动 Trae 字节跳动 AI 原生 IDE SOLO Builder/Coder 双模式、Trae Rules 引擎、MCP 协议集成、自定义智能体
Cursor Anysphere AI 驱动代码编辑器 GPT-4/Claude 3.5 双引擎、全工程上下文感知、自然语言编程、跨文件重构
  1. 拓展工具:

  1. 通义灵码插件

  • 定义:阿里云基于通义大模型的智能编码辅助工具,支持 VS Code、IntelliJ IDEA 等主流 IDE。

  • 核心功能:

    • 代码智能生成:行级 / 函数级实时续写、自然语言转代码。

    • 研发智能问答:代码解释、注释生成、异常排查。

    • 编程智能体:自主任务拆解、工程检索、文件编辑、终端执行。

    • MCP 工具使用:连接外部资源,拓展能力边界。

  • 定位:提升编码效率,降低理解和编写代码的难度。

三、工具的关系解析

技术关系全景图

OpenClaw 的定位

四、总结与拓展

上述概念共同构成了现代 AI 应用的技术栈,从基础模型到交互方式,再到能力扩展和应用落地,形成完整闭环。随着技术演进,这些概念的边界逐渐融合:

  • Agent 正从单一任务执行向多 Agent 协同发展,如华为 CodeArts Doer 的 6 大专业 Agent 分工协作。

  • Skill 生态日益丰富,成为 AI 能力复用和共享的重要形式,如 OpenClaw 支持自定义和共享 Skill。

  • MCP 协议推动 AI 与企业系统的无缝集成,成为 AI 原生应用的基础设施。

拓展方向:

  1. 多模态能力:LLM 与图像、语音等模态融合,如 Trae 支持截图解析生成代码。

  2. 企业级应用:RAG 结合私域知识库,MCP 连接企业系统,打造专属 AI 助手。

  3. 低代码 / 无代码:dify 等平台降低 AI 应用开发门槛,让非技术人员也能构建 AI 解决方案。

 

^_^
请喝咖啡 ×

文章部分资料可能来源于网络,如有侵权请告知删除。谢谢!

前一篇: 认识和使用 Ollama LLM 服务工具 和 openwebui
captcha