导图社区 人工智能
人工智能思维导图,涵盖了大语言模型LLM、开源大模型、AIGC(生成式AI)、其他等内容,内容丰富,要点梳理。
编辑于2024-11-18 08:51:02人工智能
大语言模型LLM
开源大模型
介绍
大语言模型的「幻觉」,实际上,因为参数量小又经过量化折损,适合在本地运行的模型更容易出现幻觉,严重时甚至会前言不搭后语。对此,唯一的缓解办法可能就是在条件允许的前提下,尽量运行参数更多的模型。 (llama2-chinese:13b)->(llama2-chinese:13b)可以看到,效果确实更好了一些。
使用方法
Ollama
基础信息
支持的模型
在官网查询:https://ollama.com/library
qwen
阿里大模型
qwen2
介绍
基于29 种语言的数据进行训练,包括英语和中文。
在 7B 和 72B 模型中,上下文长度已扩展至128k 个 token。
4种尺寸
0.5B
1.5B
7B
72B
Qwen 1.5
介绍
基于 Transformer 的大型语言模型
超过 2.2 万亿个 token 上进行预训练
包括中文、英文、多语言文本、代码、数学等,涵盖通用和专业领域
尺寸
0.5B
1.8B
4B
32B
72B
110B
llama
社交巨头Meta,脸书大模型
llama3
llama2
gemma
谷歌大模型
其他模型
Mistral
DeepSeek 系列
深度求索团队推出,包括针对代码训练的 DeepSeek-Coder 和 通用的 DespSeek-LLM;
Yi 系列
零一万物团队推出,有支持 20 万上下文窗口的版本可选;
MoE 模型 Mixtral-8x7B
• 如果碰巧财力雄厚,不妨试试法国明星初创团队 Mistral 最新推出的首个开源混合专家 MoE 模型 Mixtral-8x7B,需要 48GB 内存以运行;
Phi-2
• 如果不巧硬件紧张,无需气馁,Phi-2 由微软团队针对逻辑和理解精调,2.7B 的尺寸只需 4 GB 内存即可运行,吐字速度飞快,只是不太懂中文。
多模态模型
LLaVA
安装
基础使用
高级使用
常见问题
Ollama图形界面
套上外壳
Open WebUI
介绍
在本地运行大型语言模型的开源Web界面
在Windows上部署Open WebUI这个项目来实现类似chatgpt一样的交互界面。 它以前的名字就叫 Formerly Ollama WebUI。可以理解为一开始就是专门适配Ollama的WebUI,它的界面也对用惯了chatgpt的小伙伴来说更相似一些。当然,大家也可以选择其他的WebUI。
github页面:https://github.com/open-webui/open-webui
Ollama WebUI 具有最接近 ChatGPT 的界面和最丰富的功能特性,需要以 Docker 部署
安装
与ollama同台安装
Docker部署
If Ollama is on your computer, use this command: Ollama和Open WebUI在同一台主机,那使用下面显示的这一行命令就可以在本地快速进行部署: docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main 安装完成后,在Docker Desktop中可以看到
与ollama不同台安装
Docker部署
If Ollama is on a Different Server, use this command: To connect to Ollama on another server, change the OLLAMA_BASE_URL to the server's URL: docker run -d -p 3001:8080 -e OLLAMA_BASE_URL=http://10.40.152.89:11434 -v open-webui:/app/backend/data --name open-webui-98 --restart always ghcr.io/open-webui/open-webui:main
在GPU环境安装
Docker部署
To run Open WebUI with Nvidia GPU support, use this command: docker run -d -p 3000:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda
使用
访问: http://localhost:3000/ 注册账号点击sign up yxli2 yxli2@iflytek.com Lyx!920118 配置:
http://10.43.9.34:3001/
Raycast Ollama
Raycast 插件:即 Raycast Ollama,这也是我个人最常用的 Ollama 前端 UI,其继承了 Raycast 的优势,能在选中或复制语句后直接调用命令,体验丝滑。而作为价值约 8 美元/月的 Raycast AI 的平替,Raycast Ollama 实现了 Raycast AI 的绝大多数功能,且随着 Ollama 及开源模型的迭代,还将支持多模态等 Raycast AI 不支持的功能,可谓潜力无限。
终端 TUI 版 oterm
终端 TUI 版:oterm 提供了完善的功能和快捷键支持,用 brew 或 pip 安装;
其他
HuggingFace
介绍
AI模型领先平台“抱抱脸”
全球开源模型排行榜
2024年6月27日凌晨,AI模型领先平台“抱抱脸”(HuggingFace)公布全球开源模型排行榜,多款中国造开源模型上榜。 评估结果显示,阿里最新开源的Qwen2-72B指令微调版本、Meta开源的Llama-3-70B指令微调版本,以及阿里的Qwen2-72B基础版本排名前三。 李开复AI大模型公司零一万物的Yi-1.5也榜上有名,零一万物最新开源的Yi-1.5-34B-Chat版本排在了第六名。
Qwen2-72B指令微调版本
解决国内无法访问huggingface.co
国外:https://huggingface.co
国内的镜像站点:https://hf-mirror.com/
AIGC(生成式AI)
介绍
意为人工智能生成内容,全名“AI generated content”
其中包括文字、语音、代码、图像、视频、机器人动作等
如AI文本续写、文字转图像的AI图和AI主持人等
技术主要涉及两个方面:自然语言处理NLP和AIGC生成算法
AIGC应用
大模型提效
AI编码助手
AI写作
AI绘画
AI歌手
其他
语音识别(ASR)
介绍
Atomatic Speech Recognition
光学字符识别(OCR)
自然语言处理(NLP)
计算机图形学(CG)
计算机视觉(CV)