导图社区 如何从0到1打造商用AI Agent
This is a mind map about 如何从0到1打造商用AI Agent,Main content: 测试评估,部署发布,UI界面,数据库,提示工程,软件选型,需求梳理。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
如何从0到1打造商用AI Agent
需求梳理
Step1:解决什么问题
如自媒体从业者,找对标、找热点、写初稿
贸易公司老板,汇集不同平台的订单,进行价格比较
Step2:重点梳理机械化的、重复性的、不需要太多思考的工作
Step3:判断需要用到哪些工具
采集数据需要网页抓取工具
发布文章需要对接微信公众平台
软件选型
选择合适的Agent开发平台
可选平台
Coze:只能云端,不能本地部署
Dify:开源的,没有限制,知识回答方面能力较弱
FastGPT:使用有限制,知识回答能力较强
LangGraph,CrewAI:可以让AI自我规划并执行任务,但是需要编写代码
怎么选
建议:深入了解不同平台特点
选择合适的大模型
可选模型
国外:OpenAI,Claude,Gemini
国内:Kimi,Qwen,DeepSeek
开源:LLama
小模型:Minstral
没有隐私数据:Claude,OpenAI都是头部大模型
如果只是做翻译、总结文章:用国内的也行,DeepSeek性价比比较好
也可以混合使用
建议:深入了解不同模型能力、成本
小模型和大模型有什么区别
哪个模型推理能力最强
8B,32B等同一个模型参数大小
本地部署,什么样的配置能运行什么样的模型?
云端部署,计费单价是多少?企业隐私数据是否允许?
是否可以混合使用不同模型
选用不同工具执行不同系统操作
场景举例
生成图片
网上搜索
与一个系统对接
大致分两类
有API接口
Coze,Dify已经集成了很多工具可以直接配置和使用
没API接口
通过RPA来处理
通过控制浏览器来执行一系列操作的自动化工具
提示工程
目的
帮AI Agent更准确理解任务,输出效果更好
好的提示词可以降低Token的消耗、降低成本
帮助Agent更好理解上下文,确保对话的连贯性
框架
CRISPE框架
BROKE框架
ICIO框架
CoT(思维链)
交互规则
长文:多次输出比一次性输出质量更高
使用不同的符号将不同的信息重点,可以增强大模型的理解
给出事例可以更好地帮助大模型快速理解需求
负责任务差分成步骤,引导大模型分布执行效果更加
明确输出限定:如字数、格式、风格
数据库
存什么
AI Agent运行过程中产生的聊天记录
采集的数据内容
存哪
非技术人员:存到飞书的多维表格,可视化程度高,易于操作;不足是数据量变大时读取速度变慢,无法处理复杂业务逻辑
技术人员:MySQL,NoSQL
UI界面
Coze上可以DIY自己的界面
Dify上有现成界面、但不能修改
两个平台都可以发布成服务API,就是说不使用他们的界面,而开发自己的界面,与其对接
开发自己的界面,可以借助Cursor这样的AI开发平台,来定制开发一个
在Coze、Dify上可以定义多个AI Agent,用自己定义的统一界面来调用,始终在一个界面上操作
测试评估
程序报错
大模型无法处理用户请求等
输出回复是正确的
确保正确回答,并减少token消耗
用LangSmith更好评估大模型,
可以找出程序中的问题并提供解决方案
可以创建各种测试案例来测试AI Agent表现
可以观察AI Agent的工作状态,比如请求速度、花费成本等
记录所有信息,如收到的问题、给出的回答、使用的参数,方便分析改进
部署发布
不同平台有不同发布方式
Coze可以直接发布到豆包、小程序
Dify可以直接发布为Web应用
独立开发的
购买服务器单独部署