导图社区 大语言模型概述
这张思维导图概述了大语言模型的相关内容,主要涵盖大语言模型幻觉、核心特点、适用范围、定义及潜在问题。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
大语言模型概述
大语言模型幻觉
AI答非所问,未能达到所要的答案
核心特点
规模庞大
规模巨大
如GPT-3拥有1750亿参数
数据覆盖广泛
训练数据包括互联网文本、书籍、代码等
基于Transformer架构
依赖自注意力机制捕捉长距离上下文关系
GPT AEET
通用任务处理
通过提示(Prompt)完成多样化任务
如写作、编程、逻辑推理等
生成能力
能生成连贯、符合语境的文本
创作灵感
适用
非推理模型
简单直白
特点是降低提示词门槛,具有思考逻辑及链路
推理模型
适推理逻辑(哲学,数学等)
解决知识库时间限制的问题
大语言模型
能与人类对话的模型
豆包 deepseek……
大语言模型的潜在问题
答非所问
胡编乱造
浮动主题