导图社区 AI入门智能制造行业应用笔记2023
适用互联网产品经理,项目经理,技术研究爱好者共同探讨,希望此脑图对你有所帮助!
编辑于2024-01-03 17:08:46适用互联网产品经理,项目经理,技术研究爱好者共同探讨,希望此脑图对你有所帮助!
思维导图是一种高效的思考和组织信息的工具,可以帮助你更清晰、更系统地表达和整理各种想法和信息。通过将各种关联性强的信息、概念、想法、任务等内容在思维导图上进行整理,不仅能够更好地辨识事物之间的逻辑联系和内在关系,还可以有效地优化学习方法、提升创造力和解决问题的能力。学习和掌握思维导图技巧,能够帮助你更高效、更专注地工作和生活,同时也为个人和团队的发展提供更好的思考工具。
最近B站上活了的机器深度学习大神吴恩达提示词课件笔记,以及个人使用心得,适合看不同视频的人群。
社区模板帮助中心,点此进入>>
适用互联网产品经理,项目经理,技术研究爱好者共同探讨,希望此脑图对你有所帮助!
思维导图是一种高效的思考和组织信息的工具,可以帮助你更清晰、更系统地表达和整理各种想法和信息。通过将各种关联性强的信息、概念、想法、任务等内容在思维导图上进行整理,不仅能够更好地辨识事物之间的逻辑联系和内在关系,还可以有效地优化学习方法、提升创造力和解决问题的能力。学习和掌握思维导图技巧,能够帮助你更高效、更专注地工作和生活,同时也为个人和团队的发展提供更好的思考工具。
最近B站上活了的机器深度学习大神吴恩达提示词课件笔记,以及个人使用心得,适合看不同视频的人群。
AI入门智能制造行业应用笔记
基础知识
从业者基本条件
机器学习-概念
是一种人工智能的分支,它的目的是让计算机能够根据经验(数据)来自动改进算法,从而实现特定的任务。例如,在上面的例子中,计算机可以根据一些已知的照片来学习如何将未知的照片分类为狗或猫。
深度学习-概念
是机器学习的一种特殊形式,它模仿人类神经系统的结构,可以自动学习抽象的特征,例如边缘、形状、颜色等。这种结构使得深度学习在很多任务上比传统机器学习算法更为出色,例如图像识别、语音识别等。
工作过程
数据收集和预处理
数据清洗、特征提取和选择等步骤
模型选择
分类、回归、聚类
训练模型
优化算法和超参数调整
测试模型
了解模型的泛化能力,检查是否存在过拟合问题
模型应用
进行预测或分类等任务
深入岗位
算法研究员
算法工程师
研发工程师
技术要求应用分类
视觉主导的应用
静态识别
搜索变革-以图搜图/电商
照片管理-标签检索/美艳特效
动态识别
智能安防/电子围栏
直播监管
三维分析...
视觉与其他技术结合的综合应用
+自然语言处理-GPT
+人机交互-VR/AR
+生物科技-病毒辅助检测
ADAS无人驾驶/无人机
种经典神经网络
卷积神经网络(CNN)
原理
逐点相乘求平均,提取特征(值接近1)
feature map名词解释 原始图像进行过滤的结果,称之为featuremap,它是每一个feature从原始图像中提取出来的"特征"。 其中的值,越接近为1表示对应位置和feature的匹配越完整, 越是接近一1,表示对应位置和feature的反面匹配越完整, 而值接近0的表示对应位置没有任何匹配或者说没有什么关联。
池化(max pooling)提取最接近1的值
(max-pooling)保留了每一个小块内的最大值,所以它相当于保留了这一块最佳的匹配结果(因为值越接近1表示匹配越好)。 这也就意味着它不会具体关注窗口内到底是哪一个地方匹配了,而只关注是不是有某个地方匹配上了。 这也就能够看出,CNN能够发现图像中是否具有某种特征,而不用在意到底在哪里具有这种特征。 这也就能够帮助解决之前提到的计算机逐一像素匹配的死板做法。 加入池化层,可很大程度上减少计算量,降低机器负载。
扩展理解
特征可以是线条、形状、颜色等等
计算过程可以分为三个主要步骤:卷积、池化和全连接。
卷积 是指将一个滤波器(也称为卷积核)应用于输入图像的每个位置,以生成一个新的特征图。这个过程可以看作是在输入图像上滑动滤波器,计算每个位置的加权和。这个加权和就是新特征图上对应位置的值。卷积操作可以捕捉到图像中的局部特征,例如边缘和纹理 池化 是指将特征图的大小缩小,以减少计算量和参数数量。最常见的池化操作是最大池化,它将每个小区域中的最大值作为新特征图上对应位置的值。池化操作可以使特征图具有平移不变性,即不管物体在图像中的位置如何,它们的特征都可以被检测到。 全连 接层将特征图展平成一个向量,并将其输入到一个全连接神经网络中,以生成最终的输出。全连接层可以捕捉到特征之间的复杂关系,例如物体的形状和大小。
子主题
过程
增加层数:通过更抽象的概念识别物体,器官层,分子层,原子层
增加结点数:增加同一层物质的种类
应用
视觉组件,用于图像识别、语音识别、自然语言处理等任务,如医学图像识别、自动驾驶汽车、安全监控等等
循环神经网络(RNN)
原理
处理序列数据时,它会将前一个时间步的输出作为当前时间步的输入,这样就可以在处理序列数据时保留上下文信息。这种循环的结构使得RNN可以处理任意长度的序列数据。
主点相加循环网络
概要
扩展
循环神经网络 (Recurrent Neural Networks)
循环神经网络则不同,它具有一个或多个循环连接,使得它能够处理序列数据,例如文本、音频和时间序列数据。用于处理序列数据和预测问题
前馈神经网络 (Feedforward Neural Network)
前馈神经网络是一种最简单的神经网络,其特点是信息从输入层流向输出层,不存在循环连接。它适用于解决简单的回归问题或分类问题
LSTM
LSTM(Long-short time memory,LSTM)模型,亦即是长短时间模型。LSTM可以看作是一种特殊的RNN,相较于传统RN,LSTM天生就对长期依赖有着很好的支持。 LSTM模型的核心思想主要有两个,分别为记忆元组(memory cell)和非线性的门单元(nonlinear gating unit),其中记忆元组用于保持系统的状态,非线性的门单元用于在每一个时间点调节流入和流出记忆元组的信息。
过程
过程
应用
语音识别、图像描述生成领域、机器翻译、情感分析、文本生成
价值
学习工具
https://playground.tensorflow.org/
实操案例说明
层级增加,逐渐加深(HIDDEN LAYERS)
神经元(neurous)
损失(loss)
权重
扩展知识
五种方式
四种模型
分析数字虚拟人
优势
多版本,多风格(应对不同人群的需求)
不容易翻车,适用于商业(比如某星吸毒翻车对商业的影响)
虚拟人的稳定性和回报率远远高于真人
类型
3D卡通
超写实
真人形象
虚拟人通用系统框架
人物形象
建模
语音生成模块
AI
动画生成模块
动作捕捉/AI
视频合成演示模块
交互模块
真人交互
智能交互
渲染
二次元
虚拟歌手
虚拟UP主
平台架构
认知层
自然语言
知识学习
感知层
语音
视觉
虚拟现实
增强现实
基础层
算力
数据
飞桨深度学习技术
软件类
建模软件
英伟达omniverse生态
常用方案优略势对比
扩展技术-卡尔曼滤波完成动作捕捉
技术类型
结构光
人脸识别
三维建模
动态捕捉高速转动叶片
军工扫描弹道
制作流程
原图设计
白膜制作
材质制作
渲染调试
数据采集
面部捕捉
动作捕捉
数据精修
驱动模型训练
引擎能力集成
上线
AI项目经理/产品经理如何为企业赋能并自我增值
技术&专业
业务架构
技术架构
应用架构
战略框架
八大场景
顺人性
逆人性
AGI带来的突破
AGI
自动推理,使用一些策略来解决问题,在不确定性的环境中作出决策
知识表示,包括常识知识库
自动规划&学习
使用自然语言进行沟通
以及,整合以上这些手段来达到同一个的目标
必须拥有的能力
扩展
中心主题
主题
主题
主题