导图社区 《AIGC:让生成式AI成为自己的外脑》总结
这是一个关于《AIGC:让生成式AI成为自己的外脑》总结的思维导图,AIGC作为生成式AI的重要应用之一,正逐渐渗透到我们生活的各个方面。生成式AI是指能够基于已有数据生成全新、具有创造性的内容的AI技术。这种技术不仅能够提高我们的工作效率,还能在内容创作、辅助决策等领域发挥重要作用。
编辑于2024-08-16 22:42:26这是一个关于《AI自媒体写作超简单》总结的思维导图,《AI自媒体写作超简单》是一本兼具理论指导与实战技巧的实用书籍,对于想要提升自媒体写作效率与质量的创作者来说,是一本不可多得的宝贵资源。
这是一个关于《半小时漫画中国地理4:丝绸之路篇》总结(Kimi错别字检测修正版)的思维导图,是一本以漫画形式讲解中国西北五省地理知识的科普读物,兼具趣味性与知识性,适合中小学生地理启蒙。
这是一个关于《半小时漫画中国地理1-3》知识汇总:长江流域各个省份的地理(Kimi错别字检测修正版)的思维导图,以幽默漫画形式呈现长江流域地理知识,将各省份特色转化为生动角色与故事,涵盖自然景观、人文风情与区域发展亮点。
社区模板帮助中心,点此进入>>
这是一个关于《AI自媒体写作超简单》总结的思维导图,《AI自媒体写作超简单》是一本兼具理论指导与实战技巧的实用书籍,对于想要提升自媒体写作效率与质量的创作者来说,是一本不可多得的宝贵资源。
这是一个关于《半小时漫画中国地理4:丝绸之路篇》总结(Kimi错别字检测修正版)的思维导图,是一本以漫画形式讲解中国西北五省地理知识的科普读物,兼具趣味性与知识性,适合中小学生地理启蒙。
这是一个关于《半小时漫画中国地理1-3》知识汇总:长江流域各个省份的地理(Kimi错别字检测修正版)的思维导图,以幽默漫画形式呈现长江流域地理知识,将各省份特色转化为生动角色与故事,涵盖自然景观、人文风情与区域发展亮点。
《AIGC:让生成式AI成为自己的外脑》总结
第一章AIGC:智造时代来临
第一节从UGC、PGC到AIGC
1、UGC(user generated content):由用户主动创作和分享的内容
2、PGC(professional generated content):由专业人士或团队创作和制作的内容
3、AIGC(AI-generated content),指由人工智能生成的内容
4、AIGC技术方法
自然语言处理
图像生成和处理
音频合成和处理
视频生成和编辑
强化学习算法训练模型
第二节 AIGC的分类
1、生成内容
2、生成技术
规则生成
机器学习生成
3、生成目的
4、生成方式
单一生成(一种类型)
联合生成(多种类型)
交互生成(用户交互)
集成生成(整合多个)
迭代生成(迭代改进)
第三节 AIGC的发展历史
GPT系列模型的显著特点和关联词
多轮对话
对话记忆
提取信息
分析意图
语句联系
准确回答
多种语言
服务全球
多语言交互
对应回答
可扩展性
应用场景
特定知识库
多编程语言
多领域
智能推荐
用户兴趣
历史记录
相关信息
自我学习
对话学习
质量反馈
准确智能
第二章 AIGC的基础技术栈
第一节 识别的技术
1、计算机视觉系统任务
对象分类
对象标识
对象跟踪
2、计算机视觉模型
GAN技术
判别器(鉴别真伪)
生成器(生成结果)
Difussion模型
添加高斯噪声破坏数据
反转噪声恢复数据
去噪随机采样
第二节 理解与输出
1、算法语义理解
观点识别
逻辑观
充满情绪
情感极性判别
褒义
贬义
中性
情感强度判别
2、算法语音识别框架
声学模型
发音词典
语言模型
3、算法输出文本
Transformer编码器
ChatGPT(chat generative pretrained transformer)
4、算法输出音频
语音合成系统
文本分析
韵律建模
语音合成
第三节 从输出到可视
第四节 从可视到创作
AI常用训练方式
卷积神经网络(原始数据层次压缩)
神经风格迁移(参考图像内容和风格混合优化)
强化学习(试错)
第三章 AIGC的拓展技术栈
第一节 模块化设计
第二节 seq2seq模型
1、序列到序列(sequence-to-sequence,Seq2Seq)模型
2、应用
对话生成
文本摘要
趣味写作
代码补全
第三节 多模态模型
1、CLIP(contrastive language-image pre-training):联合训练、对比学习
2、ViLBERT(vision-and-language BERT):自然语言处理、计算机视觉
3、Stable Diffusion:稳定扩散模型
4、DALL-E:基于神经网络的图像生成
第四节一切的一切:ChatGPT
第四章 AIGC与文本生成
AI的缺点:不能像人类一样根据世界的发展实时更新知识库
第一节 AI文本生成与发展
1、管道(pipline):拆分计算机指令为多个步骤,由多个模态串联
2、端到端模型(Seq2Seq models):中间的神经网络自成一体
3、预训练模型(pre-trained models):训练大量语料
4、AIGC的训练过程
培训
编码
学习
生成
优化
迭代
5、国外AI文本生成的火热
ChatSonic:人工智能写作助手
OPT模型:全称为open pretrained transformer,大规模训练语言模型,完全开源,公开透明
6、国内AI文本生成的发展
ChatYuan:聊天机器人,丰富的表情、语音、视频
文心一言:百度研发的智能对话应用
WeLM:腾讯微信团队仿照GPT-3模型结构开发的生成式大语言模型,但没有开发相应的智能对话应用
第二节 AI文本生成的垂直应用
1、应用
专业客服
金融
医疗
政务
银行
智能搜索
互联网
教育
科研
智能创作
文娱
广告
动画
设计
2、AI也是学霸
3、AI扮演评委
第三节 关于AI文本生成的一些讨论
1、个人面临失业,行业面临革新
2、监管何去何从
黑客活动
开展部署恶意软件
群发垃圾邮件
大规模钓鱼
3、隐私愈发重要
信息偏差(误导、谣言、煽动)
数据泄漏(未经作者许可使用)
第五章 AIGC与图像生成
第一节 AI绘画的兴起
1、图像编辑器
2、图像生成工具
3、形象生成工具(头像、角色)
第二节 AI辅助美术设计
1、图像处理
图像识别与修复
修复瑕疵
智能分类
自动去噪
图像分割与增强
参数智能调整
自动抠图
图像生成与转换
风格转换
批量素材
高效产出
2、线条绘制的艺术
基于样本的线条生成
学习线条样本
自动化生成线条
基于规则的线条生成
利用计算机程序
灵活控制线条参数
3、风格迁移技术
内容损失:衡量图像之间的内容相似度
风格损失:衡量图像之间的风格相似度
4、布局设计
自动布局
智能排版
按需微调
智能网格
自动分割成网格
自动填充元素
自适应快调布局
预设模板
预设元素
预设布局
按需排版
第三节 AI辅助海报设计
1、步骤
图像选择
文字处理
布局设计
色彩处理
输出生成
2、优缺点
优点
快速高效
高质量
高稳定性
激发创意灵感
风格多样性
可定制化
可交互性
缺点
缺乏人类设计师的创意和想象力
无法处理复杂的设计任务
细节和情感的处理不够完善
3、未来发展趋势
个性化
兴趣
偏好
行为模式
多样化
图像
音频
视频
智能化
数据分析
图像识别
转化创意
4、技术发展
自适应设计
适应不同用户的需求以设计海报
多模态设计
图像
音频
视频
跨界合作
跨专业和领域创新
可视化创意
想象力
创意
自我学习
优化算法和模型
第四节 AI辅助专业图像生成
1、算法模型
2、数据集
⑴.作用
提高图像生成的准确性和质量
大模型数据集
训练深度学习模型
支持不同领域的专业图像生成
不同专业相关数据集
模型学习指定特征规律
促进学术研究和技术进步
公开数据集
学术界和工业界基准
评估比较生成算法
推动人工智能应用的发展
深度学习模型学习拓展
利用数据集发展和创新
⑵.常见类别数据集
对象识别/分类数据集
计算机视觉任务数据集
手写数字识别数据集
时尚物品分类数据集
3、逼真的应用场景
游戏开发
电影特效
建筑设计
服装设计
广告设计
医学图像生成
艺术创作
智能家居
虚拟现实和增强现实
第六章 AIGC的应用升级
第一节 内容生成赋能数字化转型
1、视听生态
⑴.语音合成与修复的步骤
文本预处理
分词
标记化
语法处理
文本到音素的转换
音素序列
音素到声学特征的转换
音高
音量
语速
语调
合成音频波形
⑵.音乐编辑与创作的作用
学习和分析大量的音乐作品
生成新的音乐作品
辅助和改善音乐的和声与编曲过程
分析和识别不同音轨之间的音频数据
修复和增强,去除噪声,补充音频细节,提升音质
⑶.视频编辑与剪辑的应用
视频分析与标注
视频剪辑与自动化编辑
视频增强与修复
视频效果与特效
视频生成与合成
频自动化处理
2、多模态交互下的内容创作
从文本到音频
从文本到视频
3、多模态交互的应用
娱乐业的应用
内容创作
个性化定制内容
虚拟演员
视觉效果增强
音乐创作
本地化
第二节 代码生成掀起科技浪潮
AI编程
代码自动提示和补全
代码重构和改进:重复部分、死循环、无用代码
在自动化代码维护中的应用:检测、修复
第三节 策略生成引领游戏革新
1、虚拟形象的生成
2、游戏的开发制作
GameAI的应用范围
游戏设计中
设计复杂游戏任务、关卡或谜题
创建逼真的虚拟世界和环境
游戏开发中
编写智能代理程序,使游戏中的NPC角色自主行动,适应玩家的策略和行为
游戏测试中
创建自动化测试工具和AI对战模拟器
第七章 AIGC的生态构建
第一节 上游产业的发展
1、硬件的突破
2、软件的带动
电子设计自动化类软件
操作系统类软件
基础服务类软件
安全类软件
3、数据的支持
网络安全
信息安全
数据安全
4、人才的培养
高等教育机构
大学
学院
技校
科研机构
研究所
实验室
人才服务机构
培训机构
招聘中介
政府部门
各级政府部门
行政机构
第二节 中游产业的带动
1、云计算:基于互联网的计算方式,将资源提供给用户,使用户可以随时随地通过互联网访问这些资源
2、大数据:以云计算为代表的底层架构允许并行计算,从而实现数据分析的扩容
4“V”
海量(volume)
多样(variety)
速度(velocity)
真实性(veracity)
3、机器学习:学习算法,让计算机基于数据产生模型
第三节 下游产业的繁荣
1、涉及行业
金融行业
医疗行业
媒体行业
广告行业
教育和培训行业
2、终端产品的打造
3、智能生态的构建
物联网
智能生活(智能化+自动化+互联华)
智能家居
智能安防
智能健康
政务创新
合力短视频
形成新型网络政务平台
舆情与媒体
不计其数的假新闻
数字医疗
根据病人身体数据,分析,提供治疗方案
第八章 AIGC的挑战与监管
第一节 AIGC的阿喀琉斯之踵
1、当前的不足
硬件
推理
扩大规模
特定领域的难题
2、未来的发展
更加灵活的控制
思维链
伸缩法则
持续和再训练
第二节 法律监管与问题
1、主流观点
AI自主生成的作品,不需要给予版权保护,也不需要进行法律监管
为这类作品提供版权保护会增加开发复杂AI技术的动力,并最终促使更多的原创作品进入公众视野
2、技术的B面道德与滥用
道德的争论
数据的多样性、人口代表性、性别平衡、文化多样性
种族和性别歧视倾向
不法分子的滥用
危险的宣传机器
生成代码用于网络攻击
政府仍需进一步加强监管
3、数据隐私问题
隐私保护缺失
用户身份被窃用
金融欺诈
数据滥用
轻易点击带来的安全隐患
误导性的促销广告、电子邮件、公告
恶意软件、网络钓鱼链接
盗取用户个人信息
网络黑客
几分钟内生成数百封连贯、令人信服的网络钓鱼电子邮件
第三节 产业影响与人员转型
1、AIGC的产业落地
新闻媒体
代码开发
游戏和元宇宙
广告
教育
电影
音乐
绘画
手机应用程序和功能
其他领域
药品开发
医疗咨询
制造设计
金融服务
2、AIGC对人力资源市场的冲击
⑴.传统内容制作行业:竞争压力
⑵.人力市场的新机遇:获得相关产品和服务的机会增加
⑶.普通人面临职业危机
①.AI代替内容重复性高和技能需求低的岗位
②.未来的技能要求
内容生成和编辑
数据分析和解读
创意和创新
跨领域综合能力
沟通和协作
持续学习和更新知识
③.创新和机会
创新内容、创作服务
基于AI的创作工具和平台
创新内容、创作领域
跨界合作与创新
创业机会:创办自己的AIGC公司
第九章 AIGC引领未来的变革
第一节 探索无限可能性
1、AICG改变世界
⑴.引领产业生态
①.上游基础层
预训练模型
高成本投入
高技术投入
②.中间层
任务模型
个性化
定制化
场景化
应用工具
各行业
垂直领域
功能场景
③.应用层
AIGC
文字
图像
音频
视频
⑵、人工智能的技术优势
自监督学习:从非标记数据中自动学习
因果推断:对因果关系进行建模
深度增强学习:结合强化学习与深度学习
跨领域学习:利用已有的知识来加速对新领域的学习
联邦学习:分布式设备之间共享模型参数训练模型
⑶、AIGC的前沿方向
大数据:数据集合
增强学习:自主探索、精准预测
深度学习:多层神经网络
2、AIGC面临问题
⑴.AIGC的冒险之旅
数据质量问题
模型鲁棒性问题:抗干扰
计算效率问题
隐私保护问题
可解释性问题
⑵.保障人工智能的安全
①.安全问题
信息安全
敏感信息
私密数据
模型训练
黑客攻击
新型犯罪
伪造信息
多维欺诈
公共安全
利益损害
内生安全
数据偏差
系统安全风险
技术缺陷
技术漏洞
不可解释性
决策权威性
可信度
可靠性
伦理
侵犯隐私
少数群体歧视
监管机制
算法公正度
②.安全保障措施和制度
加强数据隐私保护
设计安全的AIGC系统
强化AIGC滥用的打击力度
加强AIGC的内生安全保护
建立完善的漏洞管理机制
提升员工安全意识和技能
⑶.道理伦理边界
①.AIGC伦理问题
算法歧视
性别
年龄
隐私问题
透明度和可解释性问题
复杂
责任问题
难以界定算法决策
社会影响问题
改变就业结构
扰乱经济秩序
②.制定伦理准则和规范
制定透明的伦理准则
促进多方利益相关者的参与
加强法律监管
建立独立的审查机制
强调教育和培训
第二节 人与AI智慧共生
1、AIGC的潜在客户
2B端内容生产公司
资讯媒体
音乐流媒体
游戏公司
视频平台
影视制作公司
2C端用户
画家
写手
歌手
2、科技巨头研发AI
研发方式
云计算服务
人工智能平台
自主研发
联合开发
场景应用
图像生成
视频生成
3D建模
第三节 探索下一代数字世界的无限潜力
1、概念
⑴.元宇宙
一个虚拟的、基于区块链的多人在线世界
数字化身份
虚拟资产
社交、游戏、学习
⑵.Web3.0
互联网的下一代,“分布式Web”
更安全、更开放、更民主
技术基础
区块链
人工智能
去中心化存储
2、革命性的搭档:Web 3.0
帮助虚拟人物自动生成自然语言对话内容
数字内容的提高
可信度和去中心化程度
生产效率和质量
根据用户的兴趣和行为,自动生成有针对性的广告内容,提高广告的点击率和转化率