导图社区 温小白学AI
"AI时代已来,手把手带你玩转智能世界!温小白学AI系列涵盖从入门到进阶的全方位指南:AI应用agent产品解析、DIY智能体搭建教程,详解硬件需求与主流工具聚焦国际顶流测评平台,盘点全球TOP10大模型如KIMI、元宝、豆包,深度解析AWS AI Agent的多语言支持和模板化优势对比国内外TOP5产品,揭秘Sora等前沿技术,提供设备选型与运行参数指南从翻译编程到测试标准,助你高效驾驭AI浪潮"。
编辑于2025-07-11 22:05:32温小白学AI
全球TOP10大模型
AI发展历程
图灵测试
创始人物图灵,一个至少使世界第二次大战提前两年结束的英雄人物艾伦·麦席森·图灵(Alan Mathison Turing),英国数学家、计算机科学家、逻辑学家和密码分析学家,被誉为计算机科学与人工智能之父 。 1931年,图灵进入剑桥大学国王学院,毕业后到美国普林斯顿大学攻读博士学位。 1936年,图灵向伦敦权威的数学杂志投一篇论文,题为《论可计算数及其在判定问题上的应用》 。在这篇开创性的论文中,图灵给“可计算数”下了一个严格的数学定义,并提出著名的“图灵机”(Turing Machine)的设想。 “图灵机”不是一种具体的机器,而是一种思想模型,可制造一种十分简单但运算能力极强的计算装置,用来计算所有能想象得到的可计算函数。 “图灵机”与“冯·诺伊曼机”齐名,被永远载入计算机的发展史中。 1950年,图灵发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性 。也正是这篇文章,为图灵赢得了“人工智能之父”的桂冠。 图灵预测称,到2000年,人类应该可以用10GB的计算机设备,制造出可以骗过30%成年人的人工智能
围棋象棋
AlphaGo对战围棋:
2015年10月AlphaGo Fan击败樊麾,相关成果在2016年1月发表于Nature。 2016年3月AlphaGo Lee4:1击败尖端职业棋手李世石,韩国棋院授予有史以来第一位名誉职业九段。相较 AlphaGo Fan 等级分大约提高了 600 分。 2016年7月18日AlphaGo在Go Ratings网站排名世界第一。几天之后被柯洁反超。 2016年底至2017年年初AlphaGo Master挑战中韩日台的一流高手,60战全胜。相较 AlphaGo Lee 等级分提升了大约 1100 分。 2017年5月23至27日乌镇围棋峰会,AlphaGo Master的强化版本和世界第一棋手柯洁并配合八段棋手协同作战与对决五位顶尖九段棋手等五场比赛,获取3比零全胜的战绩,团队战与组队战也全胜。中国围棋协会授予AlphaGo职业围棋九段的称号。 AlphaGo Zero战胜AlphaGo Master,AlphaGo Zero可以在训练30天后超越 AlphaGo Master, 在训练40天后超越 AlphaGo Master 300 分。 2017年5月25日,AlphaGo在没有人类对手后,AlphaGo之父杰米斯·哈萨比斯宣布AlphaGo退役。AlphaGo的研究计划于2014年开始,从业余棋手的水平到世界第一,AlphaGo的棋力获取这样的进步,仅仅花了两年左右。
"深蓝"对战象棋
国际象棋人机大战
国际象棋人机大战,是人类与计算机之间的国际象棋比赛,最著名的国际象棋人机大战是国际象棋世界棋王加里·卡斯帕罗夫与IBM的计算机程序"深蓝"于1996年和1997年进行的两场比赛。1996年的人机大战,胜者奖金为40万美元;1997年的人机大战,IBM公司共投入资金1000万美元,出资110万美元作为比赛的奖金,胜者得奖金70万。 1996年2月10日至17日,当时世界棋王卡斯帕罗夫和"深蓝"计算机的国际象棋人机大战在美国费城举行。这次人机大战是为了纪念首都电脑计算机诞生50周年而举办的。在这场人机对弈的6局比赛中,棋王卡斯帕罗夫以4比2的总比分战胜计算机"深蓝"。首次国际象棋人机大战以人胜计算机的结果落下帷幕。比赛时,面对棋王卡斯帕罗夫而坐的是并不是计算机,而是"深蓝"研制小组的代表许峰雄。 1997年5月,IBM公司再次邀请国际象棋世界冠军、世界排名第一的俄国棋手加里·卡斯帕罗夫到美国纽约曼哈顿,跟该公司制造的97型"深蓝"("更深的蓝")计算机下6盘国际象棋。当时"深蓝"的运算能力在全球超级计算机中居第259位,每秒可运算2亿步。1997年5月11日,卡斯帕罗夫1胜2负3平,以2.5比3.5的总比分输给计算机"深蓝"。
国产AI战胜国际象棋世界冠军

智东西2024年9月25日报道,今夜,国际象棋人机大战在北京开赛,国产AI机器人“元萝卜国象机器人”先后对战15岁全国国际象棋青少年锦标赛冠军周奕宸,以及史上最年轻的世界棋后、四届女子世界冠军、女子世界排名第一的侯逸凡,并最终取胜。 “元萝卜国象机器人”是商汤科技继“象棋版”和“围棋版”后推出的第三款AI下棋机器人产品——AI下棋机器人国际象棋专业版。对战全程,由中国首位女子国际象棋世界冠军、世界棋后谢军,与商汤科技联合创始人、元萝卜总裁马堃共同进行解说、讲解和复盘。
考公研博
考公:202311月12家LLM测试考公模拟题豆包70%,GPT4Turbo为73.7% 2024年360智脑参加2025年国考测评85.9分过国家线; 考研:202501教研数学一二三试题,GPTo1第一140分以上GLM第二138.7 20250117中科院物理所“天目 杯”竞赛题,DSR1基础满分第一,GPTo1第二 2025高考:语文作文DS54.25第一,GPT4.5为53分第二,元宝51.75分,讯飞50 2025高考:数学DSR1143第一,讯飞141第二,GPTo3138分,千问第五。 2025考公:DS80分,图形推理须优化;千问65分,逻辑填写表现弱; 考研:202412月考研数学新课标卷测评(全国统考)星火85.71,九章78.57;
国外TOP5
Chat GPT4.5(Open AI)
Claude4(Anthropic)
Llama4(Meta)
Gemini3.0(谷歌)
Grok4(XAI)
国内TOP5
DeepSeek(深度求索)
R1推理模型(250528)
V3通用模型(250324)
文心一言(ERNIE Bot)4(百度)
通义千问(Qwen)(阿里)
Qwen2.5
Qwen2.5-Max 最强大的千问语言模型 Qwen2.5-Plus 能够处理复杂任务 Qwen2.5-Turbo 百万token上下文 Qwen2.5-Coder-32B-Instruct 擅长写代码 Qwen2.5-0mni-7B 支持语音聊天和视频聊天的全模态模型 Qwen2.5-14B-Instruct-1M 开源长序列模型 Qwen2.5-VL-32B-Instruct 第二大视觉语言模型 Qwen2.5-72B-Instruct 聪明的大语言模型
QVQ-Max 强大的视觉推理模型 QwQ-32B 擅长思考和推理
Qwen3--250429
小模型 (单机/手机)
0.6B 1.7B 4B 8B 14B
中模型 (企业内用)
30B Qwen3-30B-A3B 一个紧凑且高性能的混合专家(MOE)模型 32B: Qwen3-32B 最强大的密集模型
满血大模型 (专业AI企业)
235B: Qwen3-235B-A22B 最强大的混合专家语言模型
讯飞星火(Spark Desk)(科大)
知谱清言(ChatGLM)(清华)
国际顶流测评平台
测评平台
GitHub
kaggle
huggingface(GAIA)
chatbot arena
测试标准
GAIA
GAIA全称“General AI Assistant Benchmark”,是由Meta AI、Hugging Face和AutoGPT联合推出的一个旨在评估通用人工智能助手在现实问题上表现的基准测试系统
问题类型:466个问题(166公开开发集+300测试集),涵盖文本、图像、表格等多模态输入; 答案格式:唯一且简短的事实性答案(字符串/数字),支持自动化评估; 难度分级:Level 1(基础)、Level 2(多工具协作)、Level 3(复杂跨模态推理)。
MMUL
开发者与背景 由斯坦福大学团队提出14,目标是模拟人类在零样本(未接触过任务)和少样本(少量示例)场景下的知识迁移能力,更接近真实世界应用的挑战性评估。
覆盖 57个学科,涵盖 STEM(科学、技术、工程、数学)、人文、社会科学、法律、伦理等高阶领域。 包含 15,908道多项选择题,分为开发集(少量示例)、验证集(调参)和测试集。 评测指标为准确率(0-100%),区分模型在不同难度和领域的性能。
C-Eval
C-Eval 由清华大学、上海交通大学、爱丁堡大学等机构联合构建
包含 13,948 道中文多选题,覆盖 52 个学科,分为四个难度层级: 初中/高中:语文、数学、物理等标准学科; 大学:涵盖教育部划分的 13 个专业类别中的 25 个代表性学科(如计算机、金融); 专业:基于国家职业资格目录选取的 12 个职业领域(如医师、律师)
AI工具
编程
GitHub
CSDN
Couser
翻译
纳米AI搜索
沉浸式翻译
翻墙
梯子
魔法
AI使用的硬件需求
模型参数
Qwen

Deep Seek
豆包
Chat GPT
Claude
Gemini
运行条件
价格与配置
AI设备
DIY智能体搭建
Coze(字节跳动) Trae、Tars、豆包
1. Coze 功能特色 字节跳动旗下的 零代码 / 低代码 AI 应用开发平台,专注于快速搭建对话机器人(如客服、导购)。核心功能包括: 插件生态:内置 50 + 工具(如 Google Search、Stable Diffusion),支持第三方插件扩展2。 多 Bot 协同:支持多个 AI 机器人联动,适用于复杂场景(如电商多技能客服)1。 字节生态整合:深度对接豆包大模型、飞书、抖音等字节系产品,适合轻量级应用开发217。 零代码操作:通过可视化界面拖拽组件,非技术用户可快速上手17。 所属公司 字节跳动(海外版由新加坡公司 SPRING (SG) PTE.LTD 运营,国内版名为 “扣子”)17。 上市时间 未上市(字节跳动为母公司)。 收费情况 免费版:基础功能免费,模型调用次数有限(如豆包模型)17。 海外付费版:按积分消耗计费,套餐包括 Premium Lite($9.99/月)、Premium($29.99 / 月)等,积分可用于调用 GPT-4 等模型17。 国内专业版:面向企业,按功能模块和调用量收费,需联系销售定制17。 Coze:低门槛强对话体验 Coze由字节跳动推出,主打低门槛、强对话体验,适合C端用户常用的对话类应用场景,如 客服和语音助手。Coze 在 语音识别、对话流畅性方面表现尤为突出,能够为用户带来非常自然的互动体 验。其简单易用的界面和强大的对话引擎,使得即使是非技术人员也能轻松使用。 不过,Coze的定制化不足,主要面向标准化Bot开发,复杂任务扩展性较弱,且仅支持云端 部署。这对于需要高度定制化的企业来说可能不太合适。
Dify(语灵科技)
2. Dify 功能特色 开源的 AI 应用开发平台,专注于构建智能体(Agent)和复杂 AI 工作流: 多模型支持:兼容 GPT、Llama2、Claude 等主流大模型,支持私有化部署822。 可视化工作流:通过节点编排实现 RAG(检索增强生成)、多轮对话逻辑,支持动态数据处理28。 LLMOps 能力:提供模型调优、版本控制、性能监控等工具,适合技术驱动的企业823。 教育版优惠:学生 / 教师可免费获取专业版订阅7。 所属公司 苏州语灵人工智能科技有限公司(中国),核心团队来自腾讯云 CODING DevOps16;同时在美国特拉华州注册,面向全球市场23。 上市时间 未上市。 收费情况 社区版:完全免费,支持基础功能和本地部署822。 专业版:约 29 美元 / 月,包含高级功能(如团队协作、工作流版本控制)8。 企业版:按 CPU/GPU 资源、存储容量和技术支持等级收费,需定制报价8。 云托管服务:按 API 调用次数、数据处理量动态计费8。
n8n( 德国n8n.io 团队)
3. N8N 功能特色 开源的通用自动化工作流引擎,主打跨平台数据集成与任务自动化: 1000 + 连接器:支持 Slack、Google Sheets、数据库等第三方服务,可通过 API 对接自建系统218。 低代码编排:可视化节点拖拽,支持 JavaScript/JSON 数据处理,适合技术团队定制复杂流程12。 企业级扩展:支持集群部署、团队协作和权限管理18。 所属公司 n8n GmbH(德国),2025 年完成 B 轮 6000 万美元融资,红杉资本等参投18。 上市时间 未上市。 收费情况 开源版:完全免费,支持本地部署2。 云托管服务:按资源消耗收费,基础版约 29 欧元 / 月,企业版需定制报价218。 企业版:提供高级功能(如审计日志、优先级支持),价格面议18。 n8n 是一个开源的工作流自动化工具,由 n8n.io 团队开发。 n8n的起源可以追溯到2017年,由德国的 Schalk Neethling 和 Jan-Philipp Coldewey 共同创建。它的设计理念是“连接一切”,通过节点连接的方式,将各种应用程序和数据源链接起来,实现自动化操作
make(欧洲Make公司)
4. Make(原 Integromat) 功能特色 低代码自动化平台,主打跨应用数据同步与流程自动化: 500 + 预建模块:支持 Zapier、Airtable、Salesforce 等主流工具,可快速搭建自动化流程(如订单处理、数据备份)12。 可视化设计器:通过 “触发 - 动作” 逻辑编排任务,支持条件分支和循环12。 企业级扩展:提供 API 密钥管理、审计日志和 SSO 集成12。 所属公司 Make.com(捷克),2021 年曾计划 IPO 但未成功,目前仍为私有公司9。 上市时间 未上市(注:2021 年英国上市的家具电商Made.com与Make.com无关)。 收费情况 免费版:每月 1000 次操作,支持基础功能12。 专业版:19 欧元 / 月,支持无限模块和团队协作12。 团队版:49 欧元 / 月,包含高级权限和 API 访问12。 企业版:定制化报价,提供专属支持和合规功能12。
Flowith(骇斯科技)
AI 智能体平台 Flowith介绍: Flowith Neo 属于 Flowith 的母公司,其中国业务由上海骇斯科技有限公司和杭州万相创意科技有限公司负责。 Flowith 在中国上海注册了公司,名为上海骇斯科技有限公司,成立于 2023 年 2 月 10 日,其创始人兼 CEO 及法定代表人是倪正民(Derek Nee),CMO 是拐子。目前没有公开资料明确倪正民是具体哪个地方的人。 倪正民是中国人。他是连续创业者,出生于 1996 年。毕业于美国拉斐特学院,曾参与创立教育平台 XACADEMY 和社交 App Realm。2023 年,他创立了 AI 应用公司 Flowith,致力于探索下一代人机交互方式 倪正民创建过的企业如下: 2016 年:创建科技夏令营 X ACADEMY,后发展为青年社群平台和孵化器。 2018 年:大二时创建社交 APP Realm,所属公司为深圳市领域引擎科技有限公司。 2023 年:创立 AI 应用公司 Flowith,致力于探索下一代人机交互方式。 Flowith 上线时间 2024 年 4 月 18 日,Flowith 悄然开始公测。 2024 年 8 月,Flowith 正式上线。 版本状态及各版本特色 2024 年 8 月正式上线版本:推出智能体功能 Oracle,能 “让数百个 AI Agents 同时工作,无需手动搭建工作流”。 2025 年 1 月 16 日 2.0 版本:推出 Knowledge Gardens,是一个 AI 知识库市场;更新 Composer 编辑器,包括文本、图片和代码编辑器,可和画布、知识库无缝协作。 2025 年 1 月 23 日 2.0.5 版本:升级 Oracle、新增跨项目拖拽以及接入国产当红模型 DeepSeek R1。 2025 年 5 月 Agent Neo 发布:定位是给 AI 创作者的全能 Agent,是全球首个无限步骤、无限上下文、无限工具的智能体,能自主感知任务、灵活决策、多轮交互并持续进化。 2025 年 6 月:Flowith Neo 全面开放,支持超长对话和 7x24 小时云端不停歇工作能力,支持自动复杂任务处理、文本、语音、音乐、3D 模型、视频等多种输出形式,上线了 iOS 版本。 功能特点 无限拆分与多线程工作:能将复杂任务自动分解成多个子任务,并通过多线程方式并行处理,可在画布上开启多个任务节点,实时监控每个节点进展。 Agent 模式:用户把任务交给 Flowith,它会自动分解并并行执行,像雇佣了数字员工,例如可自动完成准备会议材料、邀请参会人员、安排日程等任务。 知识花园:用户可上传文档、网站链接建立自己的知识库,它在回答问题时会结合这些资料,还提供了多达 322 个在线知识花园,绝大多数免费。 多模型调用:可调用 Claude、GPT、Gemini、DeepSeek 等多种大模型,根据任务智能分配不同模型,还支持 Midioumey、SDXL 等图像生成技术。 丰富工具库:支持搜索邮件、发送代码、执行、网页抓取等 50 款工具,用户也可自定义扩展 api 接口。 界面与交互 画布式交互界面:摒弃传统聊天框模式,采用无限画布加节点网络的交互设计,用户可在画布上自由创建和连接节点,构建个人知识图谱,还可直接插入文本、图表、代码块及 AI 生成的图像,并通过箭头连接逻辑关联。 可视化操作:任务执行过程以流程图形式实时展示,用户可随时查看节点状态、修改局部内容、重启特定步骤,打破传统 AI 的黑箱模式。 技术架构 分布式智能体集群:采用微服务架构,核心组件包括基于 DAG 的工作流调度器 Orchestrator、异构智能体资源池 Agent Pool、实时更新的领域知识图谱 Knowledge Graph、安全沙箱环境 Code Interpreter。 动态工作流引擎:能够根据任务需求和智能体的状态,动态地调整工作流的执行路径和策略,提高任务处理的效率和灵活性。 会员定价 基础会员:年付 25.99 美元,包含 50 次 T-1 调用、无限 T-2 调用和 10 协作文档。 高级会员:年付 58.99 美元,包含 100 次 T-1 调用、GPT-4 Vision 和无限 Flow 创建。 钛金会员:年付 83.99 美元,包含 300 次 T-1 调用、专家智能体市场权限,单文件 400K tokens,总存储 10M tokens。 5. Flowith 功能特色 AI 交互式工具,专注于多模态内容生成与长文本处理: 多模态 Agent:支持文本、图像、3D 模型生成,可创建交互式网站、游戏等复杂内容21。 长上下文处理:支持 1000 万 token 的超长对话历史,适合专业领域(如法律、金融)的深度分析21。 数据市场:Knowledge Gardens 允许用户创建、交易数据集,用于模型训练21。 所属公司 杭州飞思人工智能有限公司(中国),成立于 2023 年,总部位于杭州21。 上市时间 未上市。 收费情况 免费版:基础功能免费,模型调用次数有限1415。 高级版:4.99 美元 / 月 / 用户,包含 800 积分(可生成 100 张图像或 114 次 AI 渲染)15。 专业版:6.99 美元 / 月 / 用户,支持无限文件存储和 1600 积分15。 无限版:16.59 美元 / 月 / 用户,解锁所有模型和高级功能15。 模型调用成本:额外按 T-1 配额计费(如 GPT-4 单次调用消耗 2 积分)14。
百度心响
以下是百度旗下通用超级智能体 **心响App** 的功能特色、所属公司、上市时间及收费情况的概括分析: 1. 功能特色 多智能体协作 基于大模型与多智能体协同技术,通过自然语言交互实现复杂任务拆解与动态执行。例如,用户输入“帮我规划五一桂林家庭游”,心响可自动调度地图、酒店、交通等多个子智能体,生成包含路线、预算、景点推荐的完整攻略。 10大场景覆盖:包括城市旅游、AI相亲、法律咨询、健康咨询、智慧图表生成等超200种任务类型,未来计划扩展至10万+场景。 MCP协议兼容:支持接入第三方工具(如地图、数据库),形成开放生态,增强任务处理能力。 全流程托管与可视化交付 无需用户手动操作中间步骤,系统自动完成任务调度并输出可视化结果。例如,输入“生成武汉近5年GDP图表”,心响可在20秒内生成动态条形图。 高频任务自动化:支持定时任务(如每日儿童故事生成、股票波动监测),结果自动推送。 技术创新与高效开发 由百度内部95后团队在30天内快速开发完成,采用“AI任务完成引擎”技术,强调“现货”交付而非“期货”概念。 搜索资源整合:依托百度搜索的信息优势,解决数据孤岛问题,提升任务准确性。 2. 所属公司 北京百度网讯科技有限公司**(百度集团旗下核心子公司)。 开发团队为百度内部自发组建的创业团队,成员以95后为主。 3. 上市时间 2025年4月17日:安卓版本率先上线各大应用商店。 2025年4月25日:在Create2025百度AI开发者大会上正式发布,同步宣布iOS版本正在审核中。 4. 收费情况 当前免费:个人用户可免费使用所有功能,无广告或订阅限制,暂未设置商业化目标。 未来计划:百度表示将通过MCP生态和第三方服务接入探索潜在商业化路径,但短期内仍以免费模式为主。 企业合作:未明确企业版定价,但强调可通过MCP协议对接企业内部系统,提供定制化解决方案。 总结 | 维度 | 百度心响(心响App) | | 核心定位 | 移动端通用超级智能体,一站式解决复杂任务,覆盖生活、工作、学习等场景 | | 技术特色 | 多智能体协作、MCP协议兼容、搜索资源整合、全流程自动化 | | 用户门槛 | 零代码,自然语言交互,非技术用户可快速上手 | | 生态整合 | 百度搜索、地图等内部资源,兼容第三方工具接入 | | 收费模式 | 完全免费(个人版),未来可能通过企业定制或生态服务盈利 | | 典型用户 | 普通消费者、职场人士、学生,尤其适合需要高效处理多场景任务的人群 | 优势与挑战: 优势:依托百度搜索与大模型技术,任务处理效率高;开放生态设计增强扩展性;免费模式降低用户使用门槛。 挑战:需解决C端用户留存问题,吸引第三方服务方入驻以丰富插件生态;未来商业化路径需平衡用户体验与盈利需求。 (注:以上信息基于2025年4月公开资料整理,具体以百度官方最新公告为准。)
AWS AI Agent(亚马逊云科技--炎黄盈动)
AWS AI Agent的特色包括: 高效处理复杂任务:通过多层级AI Agent协同工作机制,能够高效处理复杂任务,智能分配用户请求至最合适的Agent,并确保交互过程中的上下文一致性与流畅性。 支持多种编程语言:支持 Python 和 TypeScript 两种编程语言,提升了Agent的部署灵活性和适用性。 预构建Agent模板:提供多个预构建的Agent模板,支持旅行、天气、数学和健康等领域,方便用户快速部署和使用。 Amazon Transform 服务:通过专用的AI Agents,能够加速企业工作负载的云原生转换和现代化迁移,提升工作效率和成本效益
AI应用agent产品
sora
Deep Research
Manus
豆包
元宝
KIMI
纳米AI搜索