导图社区 AI人工智能学习不迷路
这是一篇关于🎓 AI人工智能学习不迷路的思维导图,主要内容包括:第一阶段:AI 必备基础,第二阶段:AI 核心算法,第三阶段:CV 计算机视觉 (Computer Vision),第四阶段:NLP 自然语言处理,第五阶段:前沿技术与部署 (LLM, Agent, RL),第六阶段:新版更新特别篇。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
🎓 AI人工智能学习不迷路
第一阶段:AI 必备基础
1. Python 基础
Python 快速入门
科学计算库 - Numpy
数据分析处理库 - Pandas
可视化库 - Matplotlib
可视化库 - Seaborn
2. AI 应用数学
高等数学基础、微积分
泰勒公式与拉格朗日
线性代数基础、特征值与矩阵分解
概率论基础、随机变量
核函数变换、熵与激活函数
统计分析:回归分析、假设检验、相关分析、方差分析、聚类分析、贝叶斯分析
第二阶段:AI 核心算法
1. 机器学习 (Machine Learning)
算法篇
回归与分类:线性回归、逻辑回归、决策树、随机森林、支持向量机 (SVM)、朴素贝叶斯
聚类与降维:K-means聚类、线性判别分析 (LDA) 降维
模型与规则:集成算法、神经网络、关联规则、隐马尔科夫模型 (HMM)
NLP基础:词向量 Word2vec 模型
项目实战篇
预测类:气温预测、股价时间序列预测、销售额预测、绝地求生排名预测、工业化生产预测、糖尿病数据预测、人口收入预测
分类与推荐:贝叶斯新闻分类、京东用户购买意向、银行客户还款预测、快手活跃度预测
系统应用:音乐推荐系统、酒店推荐系统、电影推荐系统(基于统计/Python金融量化)
2. 深度学习 (Deep Learning)
神经网络架构:基础神经网络、卷积神经网络 (CNN)、循环神经网络 (RNN)、Transformer 系列
框架与模型:PyTorch 系列、生成模型 (GAN/VAE)、自编码器、深度强化学习、图神经网络 (GNN)
神经网络识别与图像增强
迁移学习实战
CNN 文本分类
Transformer 实战系列
时间序列预测实战
第三阶段:CV 计算机视觉 (Computer Vision)
1. OpenCV 图像处理
基础操作:环境配置、阈值平滑、形态学、梯度计算、边缘检测
高级处理:图像金字塔、轮廓检测、直方图与傅里叶变换
实战项目:
信用卡数字识别、文档扫描 OCR
全景图像拼接、背景建模、光流估计
停车场车位识别、答题卡判卷
目标追踪、疲劳检测
DNN 模块应用
2. 物体检测 YOLO 系列实战
基础与评估:检测指标、经典方法概述
YOLO 演进:
V1-V3:网络架构、源码解读、训练私有数据集
V4-V5:算法解读、工程源码分析
V7-V8:最新算法与源码解读
前沿模型:Transformer-based (DETR)、EfficientDet、YOLO v9/v11/v12/v13 (区域注意力、超图理论)
3. 图像分割与缺陷检测
缺陷检测:钢材/布料缺陷检测、半监督学习
分割算法:UNet 系列(医学细胞分割)、DeepLab 系列 (V3+)、MaskFormer/Mask2Former
实例分割:Mask-RCNN 源码详解与训练
4. AI 论文实验 MMLAB 实战
MMCV/MMDet 安装与训练
分割任务与 Backbone 设计
OCR 与生成:DBNet 文字检测、ANINET 识别、StyleGAN2、关键信息抽取 (KIE)
视频与多模态:BasicVSR++ 超分、多模态 3D 检测、行为识别 (MMACTION)
优化:模型蒸馏、剪枝、注意力机制应用
5. 视频分析与姿态估计
行为识别:SlowFast 算法、3D 卷积、视频异常检测
姿态与追踪:OpenPose 源码分析、DeepSort 目标追踪
6. Transformer 视觉实战
ViT (Vision Transformer) 源码解读
Swin-Transformer
DETR 系列 (Deformable DETR)
特定领域:MedicalTransformer、LoFTR (特征匹配)、BEVFormer (自动驾驶)
7. 图神经网络 (GNN) 与 3D 点云
GNN:GCN 原理、PyTorch-Geometric 实战、分子相似度、轨迹估计
3D 点云:PointNet/PointNet++、点云补全、点云配准
8. 无人驾驶与生成对抗网络 (GAN)
自动驾驶:深度估计、车道线检测、三维重建 (NeuralRecon)、特斯拉技术解读
GAN:CycleGAN、StarGAN (变声器)、图像超分辨率、图像补全
第四阶段:NLP 自然语言处理
1. NLP 经典与实战
基础:Gemsim 词向量、HMM、LSTM 情感分析
项目:新闻分类、机器人写唐诗、对话机器人
2. Huggingface 与 BERT 生态
工具库:Transformers 工具包、GPT 系列训练与部署
BERT 实战:中文情感分析、命名实体识别 (NER)、知识抽取
知识图谱:Neo4j 数据库实战、医药问答系统、金融风控模型
3. 语音识别与推荐系统
语音:Seq2Seq、LAS 模型、语音分离 (ConvTasnet)、语音合成 (Tacotron)
推荐:协同过滤、DeepFM、知识图谱推荐、电影/音乐/酒店推荐系统
第五阶段:前沿技术与部署 (LLM, Agent, RL)
1. Agent (LLM 智能体)
平台实战:COZE (扣子) 搭建(资料收集、办公助手、小红书文案)
本地化框架:AutogenStudio、MetaGPT、RAGFlow (知识库)
微调与应用:Llama3 微调/量化/部署、斯坦福 AI 小镇架构
2. 强化学习与机器人 (RL & Robotics)
核心算法:Q-Learning, DQN, PPO, Actor-Critic (A3C)
项目:月球登陆器、超级马里奥、机器人控制
人形机器人:模仿学习范式、Mujoco 仿真、宇树机器人案例
生成模型融合:Diffusion, Dalle2, CLIP
3. 模型部署与 AIoT
部署工具:Docker, TensorFlow-Serving, NVIDIA TAO
模型优化:模型剪枝 (Network Slimming)、MobileNet 架构
边缘计算:Jetson Nano, DeepStream
4. 多模态与大模型 (Large Models)
框架:LangChain, LangGraph (多智能体)
模型技术:SAM (分割大模型), CogVideo, Llama-Factory 微调
RAG 技术:本地知识库搭建、检索增强生成全解
大模型算法:GPT 系列、BEiT 自监督、LoRA 微调、Diffusion 扩散模型
第六阶段:新版更新特别篇
1. CV 实战篇更新
基础重构:从卷积到 ViT 的演变、范式转变 (判别式->生成式)
行业应用:
AR 新零售:美瞳虚拟试戴 (Mediapipe)
互动娱乐:体感游戏系统
智能剪辑:视频分割与特效 (SAM)
数字人文:古籍智能修复
工业视觉:Anomalib 异常检测
2. LLM 实战篇更新
架构演进:MoE (混合专家模型) 深度解析、LLaMA2 从零构建
高阶微调:PEFT 策略、LoRA 变体、垂直领域微调
模型对齐:RLHF 流水线、DPO 直接偏好优化
高级 RAG:GraphRAG、混合检索、企业级架构
3. 科研与论文篇
前沿模型:RT-DETR 架构、小目标检测创新、特征金字塔重构
科研指导:论文全流程 (创新点提炼、消融实验、写作规范)
医疗 AI:时序统计模型、VAE 数据增强、临床可视化设计