导图社区人工智能

人工智能

人工智能思维导图，涵盖了大语言模型LLM、开源大模型、AIGC(生成式AI)、其他等内容，内容丰富，要点梳理。

编辑于2024-11-18 08:51:02

人工智能
大语言模型LLM
开源大模型

李彦兴

他的近期作品查看更多>>

人工智能
人工智能思维导图，涵盖了大语言模型LLM、开源大模型、AIGC(生成式AI)、其他等内容，内容丰富，要点梳理。

人工智能

社区模板帮助中心，点此进入>>

李彦兴

他的近期作品查看更多>>

人工智能
人工智能思维导图，涵盖了大语言模型LLM、开源大模型、AIGC(生成式AI)、其他等内容，内容丰富，要点梳理。

相似推荐
大纲

互联网9大思维
- 30.8k
- 2.2k
- 360
MindMaster
组织架构-单商户商城webAPP 思维导图。
- 13.8k
- 176
- 15
Kacyun
域控上线
- 1.5k
- 10
- 5
jackrao
python思维导图
- 5.1k
- 230
- 8
(*^▽^*)
css
- 1.2k
- 41
- 5
A张舫
CSS
- 3.1k
- 187
- 33
journey
计算机操作系统思维导图
- 3.9k
- 196
- 21
journey
计算机组成原理
- 1.4k
- 70
- 10
journey
IMX6UL(A7)
- 475
- 5
- 1
Handler XU
考试学情分析系统
- 611
- 10
- 1
蒋龙

人工智能

大语言模型LLM

开源大模型

介绍

大语言模型的「幻觉」，实际上，因为参数量小又经过量化折损，适合在本地运行的模型更容易出现幻觉，严重时甚至会前言不搭后语。对此，唯一的缓解办法可能就是在条件允许的前提下，尽量运行参数更多的模型。（llama2-chinese:13b）->（llama2-chinese:13b）可以看到，效果确实更好了一些。

使用方法

Ollama

基础信息

支持的模型

在官网查询：https://ollama.com/library

qwen

阿里大模型

qwen2

介绍

基于29 种语言的数据进行训练，包括英语和中文。

在 7B 和 72B 模型中，上下文长度已扩展至128k 个 token。

4种尺寸

0.5B

1.5B

72B

Qwen 1.5

介绍

基于 Transformer 的大型语言模型

超过 2.2 万亿个 token 上进行预训练

包括中文、英文、多语言文本、代码、数学等，涵盖通用和专业领域

尺寸

0.5B

1.8B

32B

72B

110B

llama

社交巨头Meta，脸书大模型

llama3

llama2

gemma

谷歌大模型

其他模型

Mistral

DeepSeek 系列

深度求索团队推出，包括针对代码训练的 DeepSeek-Coder 和通用的 DespSeek-LLM；

Yi 系列

零一万物团队推出，有支持 20 万上下文窗口的版本可选；

MoE 模型 Mixtral-8x7B

• 如果碰巧财力雄厚，不妨试试法国明星初创团队 Mistral 最新推出的首个开源混合专家 MoE 模型 Mixtral-8x7B，需要 48GB 内存以运行；

Phi-2

• 如果不巧硬件紧张，无需气馁，Phi-2 由微软团队针对逻辑和理解精调，2.7B 的尺寸只需 4 GB 内存即可运行，吐字速度飞快，只是不太懂中文。

多模态模型

LLaVA

安装

基础使用

高级使用

常见问题

Ollama图形界面

套上外壳

Open WebUI

介绍

在本地运行大型语言模型的开源Web界面

在Windows上部署Open WebUI这个项目来实现类似chatgpt一样的交互界面。它以前的名字就叫 Formerly Ollama WebUI。可以理解为一开始就是专门适配Ollama的WebUI，它的界面也对用惯了chatgpt的小伙伴来说更相似一些。当然，大家也可以选择其他的WebUI。

github页面：https://github.com/open-webui/open-webui

Ollama WebUI 具有最接近 ChatGPT 的界面和最丰富的功能特性，需要以 Docker 部署

安装

与ollama同台安装

Docker部署

If Ollama is on your computer, use this command: Ollama和Open WebUI在同一台主机，那使用下面显示的这一行命令就可以在本地快速进行部署： docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main 安装完成后，在Docker Desktop中可以看到

与ollama不同台安装

Docker部署

If Ollama is on a Different Server, use this command: To connect to Ollama on another server, change the OLLAMA_BASE_URL to the server's URL: docker run -d -p 3001:8080 -e OLLAMA_BASE_URL=http://10.40.152.89:11434 -v open-webui:/app/backend/data --name open-webui-98 --restart always ghcr.io/open-webui/open-webui:main

在GPU环境安装

Docker部署

To run Open WebUI with Nvidia GPU support, use this command: docker run -d -p 3000:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda

使用

访问: http://localhost:3000/ 注册账号点击sign up yxli2 yxli2@iflytek.com Lyx!920118 配置：

http://10.43.9.34:3001/

Raycast Ollama

Raycast 插件：即 Raycast Ollama，这也是我个人最常用的 Ollama 前端 UI，其继承了 Raycast 的优势，能在选中或复制语句后直接调用命令，体验丝滑。而作为价值约 8 美元/月的 Raycast AI 的平替，Raycast Ollama 实现了 Raycast AI 的绝大多数功能，且随着 Ollama 及开源模型的迭代，还将支持多模态等 Raycast AI 不支持的功能，可谓潜力无限。

终端 TUI 版 oterm

终端 TUI 版：oterm 提供了完善的功能和快捷键支持，用 brew 或 pip 安装；

其他

HuggingFace

介绍

AI模型领先平台“抱抱脸”

全球开源模型排行榜

2024年6月27日凌晨，AI模型领先平台“抱抱脸”（HuggingFace）公布全球开源模型排行榜，多款中国造开源模型上榜。评估结果显示，阿里最新开源的Qwen2-72B指令微调版本、Meta开源的Llama-3-70B指令微调版本，以及阿里的Qwen2-72B基础版本排名前三。李开复AI大模型公司零一万物的Yi-1.5也榜上有名，零一万物最新开源的Yi-1.5-34B-Chat版本排在了第六名。

Qwen2-72B指令微调版本

解决国内无法访问huggingface.co

国外：https://huggingface.co

国内的镜像站点：https://hf-mirror.com/

AIGC（生成式AI）

介绍

意为人工智能生成内容，全名“AI generated content”

其中包括文字、语音、代码、图像、视频、机器人动作等

如AI文本续写、文字转图像的AI图和AI主持人等

技术主要涉及两个方面：自然语言处理NLP和AIGC生成算法

AIGC应用

大模型提效

AI编码助手

AI写作

AI绘画

AI歌手

其他

语音识别（ASR）

介绍

Atomatic Speech Recognition

光学字符识别（OCR）

自然语言处理（NLP）

计算机图形学（CG）

计算机视觉（CV）