检索增强生成(RAG)、智能体与产品落地
从演示到产品:权限、成本、发布与运维常识
学习目标
- 理解演示到产品之间缺少哪些工程能力。
- 能列出人工智能功能上线前的最小检查清单。
- 知道权限、成本和监控为什么是产品化关键。
核心概念
演示用来证明想法可行,产品要在真实用户、真实数据和真实成本下持续运行。人工智能产品化至少要处理权限、成本、错误、监控、版本、发布和用户反馈。
权限在检索增强生成和工具调用中尤其重要。用户不能因为模型检索到了某段资料,就看到自己无权访问的内容。工具调用也不能因为模型生成了参数,就越过账号权限执行动作。
成本控制需要系统设计。常见手段包括限制输入长度、检索前过滤、缓存重复结果、按任务选择模型、设置用户限额、控制重试次数和记录调用成本。
示例与拆解
上线前检查清单:
1{ 2 "permissions": [ 3 "检索结果按用户权限过滤", 4 "工具调用执行前检查角色和资源归属" 5 ], 6 "cost": [ 7 "记录每次调用 token 和费用", 8 "设置单用户每日限额", 9 "限制最大上下文长度" 10 ], 11 "release": [ 12 "提示词有版本号", 13 "关键评测集通过", 14 "失败态在界面可见"
这份清单比“本地能跑”更接近产品交付。
常见误区
- 误区一:演示能跑就能上线。真实用户会触发边界输入、权限问题和成本峰值。
- 误区二:只在前端隐藏无权限内容。后端检索和工具执行也必须检查权限。
- 误区三:没有提示词版本。上线后无法判断哪次改动导致质量变化。
小练习
为你的人工智能项目写一份上线前检查清单,至少包含权限、成本、失败处理、监控和回滚五类内容。
实操检查点
把检查清单改成发布门禁表,每一项都必须有负责人、验证方式和失败处理。只写“需要监控成本”不够,要说明成本超限时系统怎么降级。
1门禁项:单用户每日调用成本限制 2负责人:后端 3验证方式:模拟超限用户继续调用接口 4失败处理:阻止新请求,提示明日恢复或联系管理员
如果某项无法验证,就不要把它当成上线保障。
随堂测验
完成本章测验,重点检查你是否理解产品化不只是把演示部署出去。
本章总结
从演示到产品,需要把权限、成本、发布、监控和运维纳入设计。人工智能能力越接近真实业务动作,产品化边界越重要。
下一步学习指引
完成本路线后,可以开始“人工智能知识助手”项目,把检索增强生成、引用、评测和产品说明组合成可交付作品。