检索增强生成（RAG）、智能体与产品落地

从演示到产品：权限、成本、发布与运维常识

45 分钟 · 进阶 · 会员章节

公开章节可直接阅读。登录后可同步阅读进度、保存笔记与高亮、完成章节测验。

创建账户登录

学习目标

理解演示到产品之间缺少哪些工程能力。
能列出人工智能功能上线前的最小检查清单。
知道权限、成本和监控为什么是产品化关键。

核心概念

演示用来证明想法可行，产品要在真实用户、真实数据和真实成本下持续运行。人工智能产品化至少要处理权限、成本、错误、监控、版本、发布和用户反馈。

权限在检索增强生成和工具调用中尤其重要。用户不能因为模型检索到了某段资料，就看到自己无权访问的内容。工具调用也不能因为模型生成了参数，就越过账号权限执行动作。

成本控制需要系统设计。常见手段包括限制输入长度、检索前过滤、缓存重复结果、按任务选择模型、设置用户限额、控制重试次数和记录调用成本。

示例与拆解

上线前检查清单：


1{
2  "permissions": [
3    "检索结果按用户权限过滤",
4    "工具调用执行前检查角色和资源归属"
5  ],
6  "cost": [
7    "记录每次调用 token 和费用",
8    "设置单用户每日限额",
9    "限制最大上下文长度"
10  ],
11  "release": [
12    "提示词有版本号",
13    "关键评测集通过",
14    "失败态在界面可见"

这份清单比“本地能跑”更接近产品交付。

常见误区

误区一：演示能跑就能上线。真实用户会触发边界输入、权限问题和成本峰值。
误区二：只在前端隐藏无权限内容。后端检索和工具执行也必须检查权限。
误区三：没有提示词版本。上线后无法判断哪次改动导致质量变化。

小练习

为你的人工智能项目写一份上线前检查清单，至少包含权限、成本、失败处理、监控和回滚五类内容。

实操检查点

把检查清单改成发布门禁表，每一项都必须有负责人、验证方式和失败处理。只写“需要监控成本”不够，要说明成本超限时系统怎么降级。


1门禁项：单用户每日调用成本限制
2负责人：后端
3验证方式：模拟超限用户继续调用接口
4失败处理：阻止新请求，提示明日恢复或联系管理员

如果某项无法验证，就不要把它当成上线保障。

随堂测验

完成本章测验，重点检查你是否理解产品化不只是把演示部署出去。

本章总结

从演示到产品，需要把权限、成本、发布、监控和运维纳入设计。人工智能能力越接近真实业务动作，产品化边界越重要。

下一步学习指引

完成本路线后，可以开始“人工智能知识助手”项目，把检索增强生成、引用、评测和产品说明组合成可交付作品。