导图社区 外行也能懂的AI体系
兼顾了广度与深度的ai体系,帮助外行了解趋势,并有通俗例子和类比。以下是易于理解的AI体系概述,帮助快速入门,再原基础上加了补充。
编辑于2025-02-25 14:28:01外行也能懂的AI体系
1. AI主流趋势
1. 技术突破
1. 自主决策AI(Agentic AI)
通俗理解:让AI像有"大脑"一样自己思考做决定,不需要人类一步步指挥。
1. 动态环境适应
做什么:让AI在突发变化中保持稳定工作
例子:自动驾驶汽车遇到突然横穿马路的行人时,能自动刹车+转向避让
类比:就像人类司机在陌生城市开车,遇到修路改道能快速调整路线
2. 多任务协调
做什么:同时处理多个关联任务
例子:仓储机器人既要搬运货物,又要避开其他机器人,还要给电池充电
类比:像餐厅经理同时安排厨师做菜、服务员上菜、处理顾客投诉
3. 自我迭代优化
做什么:AI根据运行结果自动升级
例子:客服AI通过分析对话记录,自动改进回答方式
类比:就像学生通过错题本不断修正自己的解题方法
2. 小模型崛起
通俗理解:把原本需要超级计算机运行的AI,压缩到手机都能用。
1. 参数压缩技术
做什么:精简AI的"脑容量"
例子:把原本100GB的模型压缩到2GB
类比:把百科全书精简成速查手册,保留关键知识
2. 知识蒸馏
做什么:让大模型当老师教小模型
例子:ChatGPT指导小型客服AI学习对话技巧
类比:教授把毕生所学提炼成教材给学生
3. 边缘部署
做什么:在终端设备直接运行AI
例子:手机相册自动分类照片,无需上传云端
类比:在自家厨房做饭,不用每次都去中央厨房取餐
3. 多模态融合
通俗理解:让AI能同时理解文字、图片、声音等多种信息,像人类用五感认知世界。
1. 跨模态对齐
做什么:建立不同信息类型的关联
例子:让AI知道"狗"这个文字对应狗的图片和"汪汪"声
类比:教小孩既认识"苹果"这个词,又能辨认苹果实物
2. 联合嵌入空间
做什么:把不同形式信息转换成统一"语言"
例子:把文字描述、设计草图都转成3D模型数据
类比:把英语、中文、手语都翻译成通用符号
3. 统一生成框架
做什么:用同个系统产出多种形式内容
例子:输入文字描述,同时生成配图、背景音乐和讲解视频
类比:作家写小说时同步创作插画和有声书
4. 具身智能
通俗理解:给AI装上"身体",让它们能像生物一样与真实世界互动。
1. 物理仿真训练
做什么:在虚拟世界训练AI的物理交互能力
例子:让机器人先在数字工厂练习搬运,再投入真实车间
类比:飞行员先用飞行模拟器训练
2. 传感器融合
做什么:综合处理多种感知信号
例子:扫地机器人同时分析摄像头画面、红外测距、地面摩擦力数据
类比:人类过马路时综合视觉观察+听觉判断车辆距离
3. 实时决策树
做什么:建立快速反应决策逻辑
例子:无人机遇到强风时,在0.1秒内选择悬停/返航/迫降方案
类比:足球守门员瞬间判断扑救方向的分支决策图
2. 行业应用
1. AIoT生态
通俗理解:把AI和物联网结合,让设备更聪明,比如智能家居能听懂你的话,自动调节温度
1. 低功耗芯片
做什么:降低物联网设备的功耗,延长设备续航时间。
例子:智能手环里用的芯片就是低功耗芯片,戴在手上不用经常充电。
类比:就像节能灯泡,相比普通灯泡更省电,能持续亮很久。
2. 联邦学习
做什么:在不泄露隐私数据的情况下,通过多个数据源共同训练模型,提升模型效果。
例子:多家医院各自用自己病人的数据训练疾病诊断模型,然后把模型成果汇总,得到一个更准确的通用诊断模型。
类比:就像很多人一起拼一幅巨大的拼图,每个人负责一部分,最后拼成完整的图案。
3. 设备协同
做什么:实现多个物联网设备之间的信息共享和协同工作,提高整体效率。
例子:智能家居系统中,智能门锁识别主人回家后,自动通知智能空调调整温度、智能灯光调整亮度。
类比:就像足球队里的不同球员,前锋、中场、后卫等相互配合,共同完成比赛。
2. 医疗革命
通俗理解:用新技术,比如基因编辑和AI诊断,让治病更精准、更个性化,甚至延长寿命
1. 蛋白质折叠预测
做什么:通过计算和分析预测蛋白质的三维结构。
例子:科学家利用蛋白质折叠预测技术,研究某些疾病的致病蛋白结构,为开发针对性药物提供依据。
类比:就像根据建筑蓝图预测建筑物最终的样子,帮助工程师更好地设计和施工。
2. 手术机器人
做什么:辅助或替代医生进行手术操作,提高手术的精准度和成功率。
例子:在前列腺癌手术中,手术机器人可以更精准地切除肿瘤组织,减少对周围正常组织的损伤。
类比:就像飞行员操控飞机,通过操纵杆和各种仪器精确控制飞机的飞行,手术机器人让医生更精准地进行手术操作。
3. 电子病历分析
做什么:对电子病历数据进行挖掘和分析,辅助医生诊断、治疗和科研。
例子:医生输入患者的症状和病史,系统自动分析电子病历数据库,提供相似病例的治疗方案和用药建议。
类比:就像图书馆管理员根据读者的需求,快速从大量书籍中筛选出相关的资料提供给读者。
3. 金融科技
通俗理解:用科技,比如区块链和AI,让银行、支付更快、更安全,比如手机支付和智能投顾
1. 高频交易模型
做什么:利用算法和高速计算,在极短时间内根据市场数据进行交易决策并执行交易。
例子:高频交易模型检测到某只股票在短时间内价格出现异常波动,立即买入并在价格回落时卖出,赚取差价。
类比:就像赛车手在赛道上抓住瞬间的机会超车,高频交易模型在市场波动中抓住瞬间的交易机会。
2. 反欺诈系统
做什么:通过分析交易数据、用户行为等信息,识别和防范金融欺诈行为。
例子:当信用卡用户在短时间内频繁在不同城市进行大额消费,反欺诈系统会判断这可能是欺诈行为,暂停该卡的使用并联系用户核实。
类比:就像银行的安保人员检查进出人员的证件和行为,发现可疑人员就进行盘查,防止银行被盗。
3. 智能投顾
做什么:根据用户的风险承受能力、投资目标、财务状况等信息,为用户提供投资组合建议和理财规划。
例子:一位年轻的上班族想要进行长期投资,智能投顾根据他的收入、风险偏好等因素,为他推荐了一个包含股票基金、债券基金等多种资产的组合,并定期调整。
类比:就像裁缝根据顾客的身材和需求,为顾客量身定制合适的衣服,智能投顾为用户量身定制合适的投资方案。
4. 工业4.0
通俗理解:工厂用AI、物联网和大数据,让生产更智能、更高效,比如机器能自己调整生产流程
1. 预测性维护
做什么:利用传感器和数据分析技术,对设备的运行状态进行实时监测和分析,预测设备故障并安排维护计划。
例子:工厂里的数控机床通过安装传感器,实时监测刀具磨损情况,当预测到刀具即将磨损到影响加工精度时,系统自动提醒更换刀具。
类比:就像汽车定期保养,根据里程数和车辆状况预测可能出现的问题,并提前进行保养,延长汽车使用寿命。
2. 数字孪生
做什么:通过数据采集和建模技术,创建物理实体的虚拟数字模型,并实现物理实体与数字模型之间的实时交互和同步。
例子:在航空航天领域,为飞机创建数字孪生模型,工程师可以通过模拟飞行环境对飞机进行测试和优化,减少实际飞行测试的风险和成本。
类比:就像给房子做一个3D模型,通过这个模型可以提前看到房子的内部结构和装修效果,数字孪生模型可以让人们提前了解和优化物理实体的运行状态。
3. 自动化质检
做什么:通过自动化设备和算法,对产品进行质量检测和缺陷识别。
例子:在电子芯片生产过程中,自动化质检系统通过高精度摄像头拍摄芯片表面,分析图像数据,识别出芯片表面的划痕、焊点缺陷等问题。
类比:就像工厂流水线上的质检员,通过肉眼和工具检查产品质量,自动化质检系统则更加高效和准确。
3. 伦理与治理
1. 数据隐私
通俗理解:你的个人信息,比如名字、地址,只有你同意才能用,别人不能随便看或卖
1. 差分隐私
做什么:在数据处理过程中,通过添加噪声等方式保护个体隐私。
例子:在统计城市居民的收入水平时,差分隐私技术会在数据中添加一些随机噪声,使得单个居民的具体收入无法被准确推断,但整体的收入分布情况仍然可以被了解。
类比:就像在人群中观察大家的平均身高,虽然看不到每个人的具体身高,但能知道整体的身高范围。
2. 同态加密
做什么:在加密数据上进行特定计算,保证数据隐私的同时实现数据的价值挖掘。
例子:在云计算环境中,用户将加密的数据上传到云端,云端可以在不解密数据的情况下对数据进行计算,如求和、求平均值等,计算结果返回给用户后,用户再进行解密得到最终结果。
类比:就像把一个密封的盒子送到工厂加工,工厂可以在不打开盒子的情况下对里面的物品进行加工,加工完成后用户再打开盒子得到成品。
3. 数据主权
做什么:保障数据的所有权、控制权和使用权,防止数据被非法获取和滥用。
例子:某国制定法律法规,规定本国企业和个人的数据必须存储在本国境内,未经授权不得向国外传输。
类比:就像一个国家的海关,严格检查进出境的货物,防止非法物品进出,数据主权就是保护本国数据的“海关”。
2. 算法偏见
通俗理解:AI因为数据或设计问题,对某些人不公平,比如招聘AI更偏向男性
1. 公平性评估
做什么:通过各种指标和方法评估算法在不同群体上的表现,判断是否存在偏见。
例子:在招聘算法中,公平性评估会检查算法是否对不同性别、种族的求职者有不同的筛选结果,如果发现男性求职者更容易被选中,就需要进一步分析原因。
类比:就像检查天平是否平衡,如果天平向一边倾斜,说明存在不公平的情况,需要调整。
2. 去偏正则化
做什么:在算法模型中引入正则化项,约束模型的参数,使算法在不同群体上的表现更加均衡。
例子:在信用评分算法中,去偏正则化可以防止算法因为某些群体的历史数据偏差而导致对该群体的不公平评分。
类比:就像给运动员的跑鞋安装一个平衡装置,让运动员在跑步时保持平衡,避免因鞋子问题导致的不公平竞争。
3. 可解释审计
做什么:通过可视化、特征重要性分析等方法,解释算法的决策过程和结果,以便发现和纠正可能存在的偏见。
例子:在贷款审批算法中,可解释审计可以展示算法根据哪些因素(如收入、信用记录等)做出了贷款批准或拒绝的决策,帮助人们理解算法的决策逻辑。
类比:就像医生给病人看病时,不仅要给出诊断结果,还要解释诊断的依据和治疗方案,让病人明白自己的病情和治疗过程。
3. 全球治理
通俗理解:各国一起解决全球问题,比如气候变化、网络安全,像联合国这样的组织在协调
1. 欧盟AI法案
做什么:规范人工智能的研发、应用和管理,保障公民权益和社会公共利益。
例子:欧盟AI法案要求人工智能系统在某些关键领域(如医疗、司法等)必须具备高度的透明度和可解释性,以确保公众对人工智能决策的信任。
类比:就像交通规则,规定了车辆和行人在道路上的行驶和行走规则,保障交通安全和秩序。
2. 中美技术标准
做什么:推动本国人工智能技术的发展,提高本国在国际人工智能领域的话语权和竞争力。
例子:中国在人工智能领域制定了相关的技术标准和规范,鼓励企业和科研机构按照标准进行研发和应用;美国则在人工智能的安全、伦理等方面制定了一系列政策和技术指南。
类比:就像不同国家的铁路轨距标准不同,影响着列车的运行和运输效率,中美技术标准的差异也会影响人工智能技术的交流和合作。
3. 联合国AI宪章
做什么:促进人工智能的可持续发展,保障人类的基本权益和价值观。
例子:联合国AI宪章强调人工智能的发展应该遵循公平、公正、透明、安全等原则,避免人工智能对人类造成伤害。
类比:就像联合国宪章规定了国际关系的基本准则,联合国AI宪章则为人工智能的发展提供了基本的指导原则。
4. 开源闭源之争
1. 开源阵营
通俗理解:一群人把代码公开,谁都可以用、改、分享,大家一起把技术做得更好,比如Linux和DeepSeek的开源模型
1. 商业友好协议
做什么:平衡商业利益和开源社区的贡献,促进开源项目的商业化和可持续发展。
例子:一些开源项目采用商业友好协议,允许商业公司在使用开源代码的基础上进行商业开发,但需要遵循一定的规则,如保留版权声明、开源修改后的代码等。
类比:就像在合作建房中,一方提供土地,另一方负责建设和销售,双方通过签订合作协议明确各自的权益和责任。
2. 社区协作生态
做什么:促进开发者之间的交流与合作,提高开源项目的质量和影响力。
例子:Linux操作系统就是一个典型的社区协作生态的开源项目,全球各地的开发者通过邮件列表、论坛等方式交流,共同改进和完善Linux系统。
类比:就像一群爱好者共同维护一个开源软件的“花园”,每个人都可以种植自己喜欢的“花朵”(代码),同时也可以欣赏和享受其他人种植的“花朵”。
3. 垂直领域优化
做什么:根据特定领域的需求,对开源项目进行定制化开发和优化,提高开源项目在特定领域的性能和适用性。
例子:在医疗领域,开发者们可以对开源的人工智能框架进行优化,使其更适合医学图像识别和分析。
类比:就像汽车制造商根据不同的用途(如赛车、越野车等)对汽车进行专门的改装和优化,以满足不同用户的需求。
2. 闭源阵营
通俗理解:代码不公开,只有开发它的公司能改,比如OpenAI的GPT系列,保护技术秘密
1. 私有云服务
做什么:为企业提供安全、定制化的云计算服务,保护企业的核心数据和业务隐私。
例子:一些金融机构为了保护客户的敏感信息,会选择搭建自己的私有云服务,将客户数据存储在内部环境中,由企业自己管理和维护。
类比:就像企业自己修建了一个仓库,只有企业内部的员工可以进出存放和管理货物,保证货物的安全和隐私。
2. 订阅收费模式
做什么:为企业提供稳定的收入来源,支持软件和服务的持续开发和维护。
例子:Adobe公司的Photoshop软件采用订阅收费模式,用户需要每月或每年支付一定的订阅费用才能使用该软件的最新版本和功能。
类比:就像购买会员服务,用户支付会员费后可以享受更多的特权和优质服务。
3. 技术壁垒构建
做什么:保护企业的技术优势和商业机密,提高企业的竞争力。
例子:一些科技公司会申请大量的专利技术,构建自己的技术壁垒,防止竞争对手模仿和抄袭自己的产品和技术。
类比:就像古代的城池,有高大的城墙和坚固的城门,只有城内的人可以自由出入,外人很难进入。
2. 开源模型体系
1. 明星项目
1. Meta Llama3
通俗理解:一个超级聪明的开源AI模型,能理解和生成语言,像ChatGPT一样强大,但免费且开放给所有人使用
1. 400B参数版本
做什么:凭借庞大的参数规模,更精准地理解和生成文本,提升语言处理能力。
例子:在复杂的学术论文写作中,能生成逻辑严密、内容丰富的内容。
类比:如同一个学识渊博的学者,能对各种深奥的学术问题进行深入剖析和解答。
2. 多语言支持
做什么:支持多种语言的输入和输出,进行翻译、多语言文本生成等任务。
例子:为跨国企业撰写多语言的宣传文案,或者为不同语言背景的用户提供智能客服服务。
类比:就像一个精通多种语言的国际导游,能为来自不同国家的游客提供优质服务。
3. 商业授权策略
做什么:通过不同的授权方式,如付费使用、定制化服务等,满足不同用户的需求。
例子:企业可以根据自身需求选择合适的授权套餐,用于开发智能客服系统、智能写作工具等产品。
类比:就像租房,租户根据自己的需求选择不同的房型和租赁方式,房东提供相应的服务和保障。
2. Mistral-8x7B
通俗理解:一个高效的AI模型,像有8个专家团队合作,每次只调用2个专家,既聪明又省资源
1. 混合专家架构
做什么:通过不同专家的协同工作,提高模型的处理能力和效率,更好地应对复杂多样的任务。
例子:在图像识别中,一个专家负责识别物体的形状,另一个专家负责识别颜色,共同确定物体的类别。
类比:就像一个医疗团队,有擅长诊断的医生、精通手术的医生和负责术后护理的护士,共同为患者提供全面的医疗服务。
2. 长上下文处理
做什么:在处理长文档、长对话等任务时,不遗漏重要信息,准确提取关键内容。
例子:在法律文书分析中,能理解整个案件的背景、相关条款和具体细节,给出准确的法律意见。
类比:就像一个人阅读一本长篇小说,能记住众多的人物关系、情节发展,理解小说的主题和内涵。
3. 端侧部署方案
做什么:优化模型结构和算法,使其适应终端设备的资源限制,实现高效的本地推理。
例子:在智能手机上安装智能语音助手,用户可以通过语音指令进行查询、操作等,无需连接网络。
类比:就像把一个小型的智能办公室装在口袋里,随时随地都能使用各种办公功能。
3. DeepSeek V3
通俗理解:一个国产的超级AI,既能快速回答问题,又能深度思考复杂问题,像一位全能助手
1. 千亿参数级
做什么:凭借庞大的参数规模,更准确地捕捉数据中的规律和特征,生成高质量的结果。
例子:在自然语言处理中,能生成更加自然、流畅的文本,在知识问答中给出更准确、详细的答案。
类比:就像一个拥有海量知识的超级图书馆,能为用户提供各种领域的详细信息和专业解答。
2. 中文优化
做什么:优化中文词汇、语法、语义等方面的处理能力,提高中文文本生成的质量和相关性。
例子:在中文写作中,能生成符合中文表达习惯、富有文采的文章,在中文翻译中准确传达原文的意思和风格。
类比:就像一个精通中文的语言大师,能写出优美动人的中文作品,进行高质量的中文翻译。
3. API经济模式
做什么:为开发者提供丰富的API接口,支持各种应用场景的开发,同时通过收费等方式实现商业盈利。
例子:开发者可以利用DeepSeek V3的API开发智能写作工具、智能客服系统等产品,为用户提供更好的服务。
类比:就像一个电力公司,通过电网(API)为各种电器设备(开发者应用)提供电力(模型功能),收取电费实现盈利。
2. 技术特性
1. 模型架构
通俗理解:AI模型的“骨架”,决定了它如何学习和处理信息,就像人的大脑结构决定了思维方式
1. Transformer变体
做什么:通过改进注意力机制、层结构等方式,提高模型的性能和效率。
例子:在处理长序列数据时,采用稀疏注意力机制的Transformer变体可以减少计算量,提高处理速度。
类比:就像对一辆汽车进行改装,更换更强大的发动机和更先进的悬挂系统,提高汽车的性能和赛道表现。
2. MoE结构
做什么:根据输入数据的特点,动态选择合适的“专家”进行处理,提高模型的处理能力和效率。
例子:在图像识别中,一个“专家”负责识别动物,另一个“专家”负责识别植物,当输入一张动物的图片时,相应的“专家”会被激活进行处理。
类比:就像一个医院,有不同的科室(专家),如内科、外科、妇产科等,患者根据病情被送到相应的科室进行治疗。
3. 稀疏激活
做什么:通过设计合适的稀疏激活机制,使模型在处理数据时只关注重要的信息,忽略无关的信息。
例子:在处理大规模文本数据时,稀疏激活可以使模型只关注与当前任务相关的词汇和语义信息,提高处理速度。
类比:就像一个人在图书馆找书,不会把所有的书都看一遍,而是根据目录和索引,直接找到自己需要的书。
2. 训练策略
通俗理解:教AI学习的方法,就像老师教学生,通过大量数据和反复练习让它变得更聪明
1. 课程学习
做什么:先让模型学习简单的任务和数据,然后逐渐增加难度和复杂度,使模型能够稳定地学习和提高性能。
例子:在训练语言模型时,先让模型学习简单的单词和句子,然后逐渐学习复杂的文章和篇章结构。
类比:就像建造房屋,先打好地基,然后一层一层地往上盖,确保房屋的稳固和安全。
2. 强化学习对齐
做什么:设计合适的奖励机制和目标函数,让模型在训练过程中不断调整自己的行为,以获得最大的奖励。
例子:在训练自动驾驶汽车时,设置安全驾驶、遵守交通规则等奖励机制,使汽车学会正确地行驶和避让。
类比:就像训练宠物狗,通过奖励和惩罚的方式,让狗学会听从主人的指令,做出正确的行为。
3. 数据合成
做什么:利用现有的数据和算法,生成新的、多样化的数据,使模型能够学习到更多的知识和模式。
例子:在图像生成中,通过对真实图像进行变换、组合等操作,生成新的图像数据,用于训练图像识别模型。
类比:就像厨师通过创新菜品,为食客提供更多样化的美食选择,满足不同人的口味需求。
3. 推理优化
通俗理解:让AI更快、更省资源地思考,就像给电脑升级,让它运行得更流畅
1. 量化压缩
做什么:在不显著降低模型性能的前提下,通过量化技术将模型的参数和数据转换为低精度的数据类型,如8位整数、4位整数等。
例子:在移动设备上部署模型时,采用量化压缩技术可以使模型占用更少的存储空间,运行速度更快。
类比:就像把一本厚厚的书进行缩印,使其体积变小,便于携带和阅读,同时内容基本保持不变。
2. 注意力优化
做什么:通过设计新的注意力算法、优化注意力计算过程等方式,使模型能够更快速、准确地捕捉到关键信息。
例子:在处理长文本时,采用稀疏注意力机制可以只关注与当前任务相关的部分,而不是对整个文本进行全注意力计算。
类比:就像在人群中寻找特定的人,不需要关注每个人的面容和特征,只需要关注与目标人物相关的特征和线索。
3. 批处理加速
做什么:在模型推理过程中,将多个输入数据同时输入模型进行计算,而不是逐个输入计算,从而减少计算时间和资源消耗。
例子:在图像识别中,将多张图片组成一个批次输入到模型中进行识别,比逐张图片识别速度更快。
类比:就像工厂里的流水线作业,将多个零件同时放在流水线上进行加工,提高生产效率。
3. 应用场景
1. 企业私有化部署
做什么:企业可以根据自己的业务流程和需求,对模型进行个性化配置和优化,实现与企业现有系统的无缝集成,提高企业的生产效率和竞争力。
例子:金融机构利用私有化部署的AI模型进行风险评估、欺诈检测等业务,保护客户的敏感信息和交易数据。
类比:就像企业自己建造了一个专属的仓库,只有企业内部的员工可以进出和使用,能够更好地管理和保护企业的货物和资产。
2. 学术研究支持
做什么:提供丰富的开源模型、数据集和开发工具,支持研究人员进行模型训练、算法优化、应用开发等工作,促进学术交流和合作。
例子:科研人员利用开源模型进行自然语言处理、计算机视觉等领域的研究,探索新的算法和技术,发表高水平的学术论文。
类比:就像为科学家提供了一个先进的实验室,里面配备了各种先进的仪器设备和实验材料,方便他们进行科学研究和探索。
3. 初创公司基建
做什么:提供易于使用的API接口、开发工具和示例代码,帮助初创公司快速集成AI功能到自己的产品中,同时提供技术咨询和培训服务,支持他们的技术创新和业务发展。
例子:一家初创的教育科技公司利用开源模型开发智能辅导系统,为学生提供个性化的学习辅导服务。
类比:就像为创业者提供了一个现成的店铺框架和装修方案,他们只需要根据自己的业务需求进行个性化布置和商品陈列,就可以快速开业经营。
3. 研究领域纵深
1. 机器学习
1. 监督学习
通俗理解:AI像学生一样,通过老师给的正确答案学习,比如教它识别猫和狗
1. 分类模型
做什么:将输入数据划分到不同的类别中,比如判断邮件是垃圾邮件还是正常邮件。
例子:通过大量已标记的花朵图片(如玫瑰、郁金香等),训练模型来识别新的花朵图片属于哪种类别。
类比:就像根据人的外貌特征(身高、体型等)来判断是男性还是女性。
2. 回归分析
做什么:根据一个或多个自变量的值预测因变量的数值,比如根据房屋面积、房龄等因素预测房价。
例子:根据历史销售数据(如广告投入、促销活动等)预测未来的销售额。
类比:就像根据汽车行驶的时间和速度来预测行驶的距离。
3. 序列预测
做什么:预测序列中下一个或多个元素,比如预测股票价格的走势、天气的变化等。
例子:根据过去一段时间的股票价格数据,预测未来几天的股票价格。
类比:就像根据过去的天气情况(如温度、湿度等)来预测未来几天的天气。
2. 无监督学习
通俗理解:AI自己从数据中找规律,像小孩自己玩积木,摸索出怎么搭房子
1. 聚类算法
做什么:发现数据中的自然分组结构,比如对客户进行细分,以便进行针对性的营销。
例子:根据用户的消费行为(购买频率、购买金额等)将用户分为不同的群体。
类比:就像将一群学生按照成绩和兴趣爱好分成不同的小组。
2.降维技术
做什么:减少数据的维度,同时保留数据的主要特征,比如将二维平面上的点投影到一维直线上。
例子:将具有多个特征的图像数据进行降维处理,以便更直观地观察和分析数据。
类比:就像将一幅复杂的立体图像简化为二维平面图,同时保留主要信息。
3.生成模型
做什么:生成与训练数据相似的新数据,比如生成新的图像、文本等。
例子:通过学习大量猫的图片,生成新的猫的图片。
类比:就像根据已有的故事模板生成新的故事。
3. 强化学习
通俗理解:AI通过试错和奖励学习,像训练小狗,做对了给零食,做错了不给
1.马尔可夫决策
做什么:在动态环境中,通过不断选择最优行动来达到目标,比如机器人在复杂环境中寻找最优路径。
例子:机器人在迷宫中寻找出口,根据当前位置和周围环境选择下一步的移动方向。
类比:就像下棋时,根据当前的棋局局势选择最佳的落子位置。
2.深度Q网络
做什么:在复杂的游戏或任务中学习最优策略,比如玩Atari游戏。
例子:训练一个深度Q网络来玩超级马里奥游戏,让智能体学会如何控制角色移动、跳跃等动作以获得最高分数。
类比:就像训练一个智能宠物,让它学会在不同环境下做出正确的反应以获得奖励。
3.多智能体系统
做什么:协调多个智能体的行为,以实现共同的目标或解决复杂的问题,比如多机器人协作完成装配任务。
例子:多个自动驾驶汽车在道路上行驶,需要相互协作避免碰撞并优化交通流量。
类比:就像一群人合作完成一项大型工程,每个人负责不同的任务,共同实现工程目标。
2. NLP前沿
1. 语义理解
通俗理解:AI能理解语言的真正含义,像听懂“今天天气怎么样”背后的意思
1.语境建模
做什么:根据上下文信息准确理解词语和句子的语义,比如在不同语境中“苹果”可能指水果也可能指手机品牌。
例子:“苹果真好吃”,结合语境可能是指水果苹果;“苹果公司发布了新手机”,这里的“苹果”指手机品牌。
类比:就像理解一个人说话的意思需要结合当时的场景和背景信息。
2.情感分析
做什么:识别文本中的情感信息,用于舆情监测、产品评论分析等。
例子:分析用户在电商平台上对某产品的评论是好评还是差评。
类比:就像通过观察一个人的表情和语气来判断他的心情。
3.知识图谱
做什么:整合和关联各种知识,帮助理解和推理文本信息,比如查询某个历史人物的相关事迹。
例子:在百科知识中,通过知识图谱可以了解到爱因斯坦与相对论、诺贝尔物理学奖等相关知识之间的联系。
类比:就像一张地图,标注了各个地点以及它们之间的道路和关系。
2. 文本生成
通俗理解:AI能写文章、编故事,像一位自动写作助手
1.可控生成
做什么:控制生成文本的内容、风格、长度等方面,比如生成特定主题的新闻报道。
例子:给定主题“科技发展对生活的影响”和字数要求1000字,生成一篇符合要求的文章。
类比:就像按照给定的配方和步骤制作一道菜。
2.风格迁移
做什么:学习不同文本风格的特征,并在生成文本时应用相应的风格特征。
例子:将一段严肃的新闻报道转换为幽默风趣的表述方式。
类比:就像把一首古典音乐改编成流行音乐的风格。
3.事实一致性
做什么:在生成文本时,根据已有的知识和数据进行验证和修正,保证信息的准确性。
例子:生成关于历史事件的描述时,要依据可靠的历史资料,确保事件的时间、地点、人物等信息准确无误。
类比:就像写学术论文时,要确保引用的数据和观点都有可靠的依据。
3. 多语言处理
通俗理解:AI能听懂和说多种语言,像一位多国语言翻译官
1. 低资源语言
做什么:研究和开发适合低资源语言的处理方法和技术,促进低资源语言的应用和发展。
例子:一些少数民族语言或小语种,由于使用人数少,相关的语料和工具较少,需要专门的研究来改善其处理效果。
类比:就像研究一些珍稀植物,需要投入更多的精力去了解和保护它们。
2. 机器翻译
做什么:通过训练模型学习不同语言之间的对应关系,实现高质量的翻译。
例子:使用在线翻译工具将英文句子翻译成中文。
类比:就像一个翻译员在不同语言之间进行口译或笔译。
3. 跨语言检索
做什么:解决不同语言之间的语义差异和语言障碍,实现有效的跨语言信息检索。
例子:用中文关键词在包含多种语言的数据库中检索相关的英文文献。
类比:就像在国际图书馆中,用一种语言查找其他语言的书籍。
3. 计算机视觉
1. 图像识别
通俗理解:AI能看懂图片,像人一样认出照片里的猫、狗或风景
1. 物体检测
做什么:检测图像中是否存在特定的物体,并确定其位置和大小,比如在监控视频中检测行人、车辆等。
例子:在一张城市街道的照片中检测出汽车、行人、路灯等物体,并框出它们的位置。
类比:就像在一幅画中找出所有的苹果,并用框把它们圈出来。
2. 场景理解
做什么:分析图像中的物体、背景、光照等因素,推断出场景的类别和含义,比如判断是室内场景还是室外场景。
例子:根据一张包含餐桌、餐具和人物的图片,判断这是一个餐厅场景。
类比:就像通过观察一个房间的布置和物品摆放来判断这个房间的用途。
3. 细粒度分类
做什么:在已有类别基础上进一步细分,比如将猫细分为波斯猫、暹罗猫等不同品种。
例子:在动物图片数据集中,不仅要识别出是猫还是狗,还要能分辨出具体是哪个品种的猫。
类比:就像区分不同品牌、型号的手机,而不仅仅是知道是手机。
2. 视频分析
通俗理解:AI能看懂视频,像警察看监控,找出可疑行为
1. 行为识别
做什么:分析视频序列中的帧图像,提取特征并判断行为的类别和状态。
例子:在监控视频中识别出人员是否有异常行为,如打架、偷窃等。
类比:就像观察一个人的动作来判断他在做什么。
2. 时序建模
做什么:捕捉视频中物体或行为随时间的变化规律,比如预测物体的运动轨迹。
例子:分析足球比赛中球员的运动轨迹,预测球的走向和可能的进球情况。
类比:就像根据河流过去的水流情况预测未来的水位变化。
3. 内容生成
做什么:利用生成模型学习视频数据的特征和模式,生成新的视频片段或场景。
例子:根据一段文字描述生成相应的视频内容,如根据“美丽的海边日落”生成一段视频。
类比:就像根据一幅草图创作一幅完整的画作。
3. 三维视觉
通俗理解:AI能看懂3D世界,像人眼一样感知物体的深度和形状
1. 点云处理
做什么:提取点云数据的特征,进行目标识别、形状分析等操作,常用于自动驾驶、机器人感知等领域。
例子:在自动驾驶中,通过处理激光雷达获取的点云数据来识别道路、车辆和行人。
类比:就像对一堆杂乱的积木进行分类和整理。
2. 神经渲染
做什么:学习三维模型到二维图像的映射关系,生成逼真的渲染结果,用于虚拟现实、游戏等领域。
例子:在虚拟游戏中,通过神经渲染生成逼真的游戏场景和角色动画。
类比:就像用相机拍摄一个三维模型,得到高质量的二维照片。
3. SLAM技术
做什么:通过传感器(如激光雷达、摄像头等)获取环境信息,结合算法实现机器人的自主定位和地图构建。
例子:扫地机器人在房间内工作时,通过SLAM技术确定自己的位置并绘制房间的地图,以便高效地清扫。
类比:就像一个人在陌生的城市中通过观察周围环境和地标来确定自己的位置,并绘制出行走路线。
4. 具身智能
1. 机器人学习
通俗理解:教机器人像人一样思考和行动,像训练一个智能助手
1. 模仿学习
做什么:让机器人观看人类示范的操作过程,然后尝试复制这些动作,比如学习人类如何系鞋带。
例子:训练机器人在装配线上模仿工人的操作动作进行产品组装。
类比:就像小孩子通过观察大人的行为来学习走路、说话等技能。
2. 触觉反馈
做什么:利用触觉传感器获取接触信息,调整机器人的动作和操作,比如机器人在抓取物体时根据触觉反馈调整抓取力度。
例子:机器人在搬运易碎物品时,通过触觉反馈感知物品的形状和质地,避免损坏物品。
类比:就像人用手触摸物体时能感受到物体的硬度、光滑度等信息,从而调整拿取的方式。
3. 操作规划
做什么:分析任务需求和环境条件,规划出最优的操作方案,比如机器人在搭建积木时规划每一步的放置位置。
例子:机器人在完成复杂的装配任务时,先规划好各个零部件的装配顺序和动作路径。
类比:就像建筑工人在建造房屋前,先设计好施工图纸和施工流程。
2. 环境交互
通俗理解:AI能感知和适应周围环境,像人一样在房间里找到路
1. 物理引擎
做什么:计算物体之间的碰撞、摩擦、重力等物理效果,为机器人的操作提供真实的物理反馈。
例子:在机器人模拟训练中,通过物理引擎模拟机器人与物体的碰撞和摩擦,让机器人学习如何正确操作。
类比:就像在电子游戏中,物理引擎让游戏中的物体具有真实的物理行为。
2. 多模态感知
做什么:融合不同模态的感知数据,提高机器人对环境的理解和判断能力,比如根据视觉和触觉信息判断物体的形状和质地。
例子:机器人在探索未知环境时,通过摄像头观察周围环境,同时用触觉传感器感知物体的表面特征。
类比:就像人通过眼睛看、耳朵听、手触摸等多种方式来感知周围的世界。
3. 长期记忆
做什么:建立记忆机制,记录机器人的操作经历、学习到的知识和环境变化等信息,并在需要时进行检索和应用。
例子:机器人在多次完成装配任务后,能够记住不同零部件的装配方法和技巧,在后续任务中更高效地完成装配。
类比:就像人有记忆一样,能够根据过去的经验来处理当前的问题。
3. 人机协作
通俗理解:人和AI一起工作,像搭档一样互相配合完成任务
1. 安全协议
做什么:规定机器人的行为边界、操作规范以及与人类的交互方式,避免发生碰撞、伤害等安全事故。
例子:在工业生产中,设置机器人的工作区域和速度限制,当人类进入危险区域时,机器人自动停止工作。
类比:就像交通规则,规定了车辆和行人的行为准则,保障交通安全。
2. 意图理解
做什么:通过分析人类的语言、动作、表情等信息,推断人类的意图,并做出相应的响应。
例子:在医疗手术中,机器人能够理解医生的指令和意图,准确地完成手术操作。
类比:就像朋友之间能够理解对方的想法和需求,从而更好地合作完成某件事情。
3. 任务分配
做什么:分析任务需求和机器人、人类的能力,制定任务分配方案,确保任务的顺利完成。
例子:在物流仓库中,机器人负责搬运重物和长距离运输,人类负责分拣和包装小件物品。
类比:就像一个团队中,根据成员的专业技能和特长分配不同的工作任务。
4. 基础概念矩阵
1. 技术要素
1. 大模型特性
通俗理解:超级AI的特点,比如能处理海量数据、理解复杂问题,像一位全能博士
1. 涌现能力
做什么:通过大规模训练,模型能够自动学习并发现新的、更高级的特征和模式。
例子:GPT-3在未见过的任务上表现出色,能够根据指令生成预期的输出。
类比:就像一个人通过学习大量知识后,能够解决从未遇到过的问题。
2. 思维链
做什么:在提示词中加入推理步骤,帮助模型更好地理解问题并生成正确答案。
例子:在数学问题中,模型通过逐步推理得出最终答案。
类比:就像解题时先列出步骤,再一步步推导出结果。
3. 指令微调
做什么:在特定任务上对模型进行微调,提升其在未见任务上的表现。
例子:通过指令微调,模型能够根据用户指令生成特定风格的文本。
类比:就像给员工进行专项培训,使其更好地完成特定任务。
2. 多模态架构
通俗理解:AI能同时处理文字、图片、声音等多种信息,像一位多才多艺的艺术家
1. CLIP模型
做什么:实现图像和文本的跨模态检索和生成。
例子:根据文本描述检索相关图像,或根据图像生成描述性文本。
类比:就像一个人既能看懂图片,又能理解文字描述。
2. 跨模态检索
做什么:根据一种模态的输入,检索另一种模态的相关信息。
例子:根据文本描述检索相关图像,或根据图像检索相关文本。
类比:就像根据书名找到对应的电影海报。
3. 联合生成
做什么:根据输入生成多种模态的输出,如图像和描述性文本。
例子:根据文本描述生成对应的图像。
类比:就像根据剧本拍出电影。
3. 推理机制
通俗理解:AI的“思考方式”,像人一样一步步分析问题并得出结论
1. 自回归生成
做什么:在生成文本或图像时,模型逐步生成每个部分,直到完成整个序列。
例子:GPT模型逐步生成文本,每次生成一个词。
类比:就像写文章时,先写开头,再逐步完善内容。
2. 检索增强
做什么:在推理过程中,模型检索相关外部信息,提升推理的准确性。
例子:在回答复杂问题时,模型检索相关文档以辅助推理。
类比:就像在解题时查阅参考书。
3. 逻辑推理
做什么:在需要逻辑推理的任务中,模型通过逻辑规则推导出答案。
例子:在数学证明题中,模型通过逻辑推理得出证明过程。
类比:就像在数学题中通过逻辑推导出答案。
2. 应用范式
1. AI Agent
通俗理解:AI像一位智能助手,能独立完成任务,比如订机票或安排日程
1. 记忆模块
做什么:通过记忆模块,Agent能够记住过去的操作经历和学习到的知识。
例子:智能客服Agent记住用户的偏好,提供个性化服务。
类比:就像人通过记忆记住过去的经验,帮助未来决策。
2. 工具调用
做什么:通过调用工具,Agent能够扩展其功能,完成更复杂的任务。
例子:Agent调用搜索引擎获取最新信息,辅助回答问题。
类比:就像人使用工具来完成复杂的任务。
3. 反思机制
做什么:通过反思机制,Agent能够识别错误并优化未来的决策。
例子:Agent在生成错误答案后,通过反思机制修正错误。
类比:就像人在完成任务后,回顾并改进自己的工作。
2. 合成数据
通俗理解:AI自己生成的数据,像虚拟世界里的假信息,用来训练模型
1. 隐私保护
做什么:生成与真实数据相似的合成数据,用于模型训练,避免隐私泄露。
例子:在医疗领域,生成合成患者数据用于模型训练。
类比:就像用假名代替真实姓名,保护隐私。
2. 数据增强
做什么:生成多样化的合成数据,增加训练数据的多样性。
例子:在图像识别中,生成不同角度和光照条件下的合成图像。
类比:就像通过增加练习题来提升学习效果。
3. 领域适配
做什么:生成与特定领域相关的合成数据,提升模型在该领域的表现。
例子:在自动驾驶中,生成不同天气条件下的合成数据。
类比:就像针对特定考试进行专项训练。
3. 端侧AI
通俗理解:AI直接装在手机、电脑等设备上,像把大脑装进设备里,不需要联网也能用
1. 模型轻量化
做什么:减少模型的参数量和计算量,使其适合在手机、智能手表等设备上运行。
例子:在手机上运行轻量化的语音助手模型。
类比:就像将大型软件优化为适合手机的小型应用。
2. 即时推理
做什么:在设备本地进行推理,减少延迟,提升响应速度。
例子:在智能音箱上实时进行语音识别。
类比:就像在本地处理文件,无需上传到云端。
3. 离线部署
做什么:在设备上部署模型,支持离线使用,提升隐私保护。
例子:在智能手表上离线运行健康监测模型。
类比:就像在没有网络的情况下使用本地应用。
3. 伦理维度
1. 算法公平
通俗理解:让AI做决定时不偏袒任何人,比如招聘时不分性别、种族,像一位公正的裁判
1. 群体平等
做什么:通过公平性评估和去偏技术,减少算法对不同群体的偏见。
例子:在招聘算法中,确保对不同性别和种族的候选人公平对待。
类比:就像在考试中确保所有考生公平竞争。
2. 机会均等
做什么:通过设计公平的算法,确保所有用户都能平等地获得服务。
例子:在推荐系统中,确保所有用户都有机会看到多样化的内容。
类比:就像在比赛中确保所有选手都有平等的机会。
3. 补偿机制
做什么:通过设计补偿机制,减少算法对不同群体的负面影响。
例子:在贷款算法中,对受歧视的群体进行补偿。
类比:就像在比赛中对受伤的选手进行补偿。
2. 可控性
通俗理解:AI的决策过程可以被人类理解和调整,像开车时能随时踩刹车,确保它不会失控
1. 安全护栏
做什么:通过设计安全机制,确保算法在可控范围内运行。
例子:在自动驾驶中,设置安全护栏防止车辆失控。
类比:就像在游戏中设置安全区域,防止玩家误操作。
2. 价值观对齐
做什么:通过价值观对齐技术,确保算法的决策符合人类的道德标准。
例子:在AI助手中,确保其回答符合社会道德规范。
类比:就像在团队中确保每个人的行为符合团队价值观。
3. 终止开关
做什么:通过设计终止机制,确保在紧急情况下能够停止算法。
例子:在AI系统中,设置终止开关以防止系统失控。
类比:就像在机器上设置紧急停止按钮。
3. 社会影响
通俗理解:AI改变我们的生活,比如推荐系统让我们看到喜欢的内容,但也可能让我们陷入“信息茧房”,像一面镜子,既反映也塑造社会
1. 就业重构
做什么:通过培训和再就业计划,帮助劳动者适应新的就业环境。
例子:在制造业中,自动化技术取代部分人工操作。
类比:就像工业革命中机器取代部分手工劳动。
2. 信息生态
做什么:通过算法优化和监管,确保信息传播的公平性和准确性。
例子:在社交媒体中,AI算法影响信息的传播和推荐。
类比:就像在新闻媒体中,编辑影响信息的传播。
3. 认知革命
做什么:通过AI技术,提升人类的认知能力和决策效率。
例子:在医疗诊断中,AI辅助医生进行更准确的诊断。
类比:就像计算机辅助人类进行复杂的计算。
5. 未来延伸方向
1. 地缘科技
1. 中美算力竞赛
做什么:中美两国在人工智能和高性能计算领域展开激烈竞争,争夺全球算力主导权。
例子:美国通过《芯片与科学法案》限制对华出口高端芯片,中国则通过算法优化和国产芯片突破算力瓶颈
类比:就像两个超级大国在科技领域的“军备竞赛”,双方都在不断升级技术以保持领先地位。
2. 稀土供应链
做什么:稀土作为高科技产业的关键原材料,其供应链成为中美博弈的焦点。
例子:中国控制全球90%的稀土加工能力,美国试图通过开发本土稀土资源和技术转移打破依赖
类比:就像控制石油的国家掌握能源命脉,稀土供应链的掌控者决定高科技产业的未来。
3. 技术出口管制
做什么:美国通过出口管制限制中国获取先进技术,中国则通过自主研发和开源生态突破封锁。
例子:美国禁止英伟达向中国出售高端AI芯片,中国通过开源模型和国产芯片实现技术替代
类比:就像一场“技术冷战”,双方通过限制和突破来争夺技术主导权。
2. 融合创新
1. 脑机接口
做什么:通过将脑信号转化为控制指令,实现人脑与外部设备的直接交互。
例子:天津大学与清华大学研发的“双环路”脑机接口系统,实现意念操控无人机
类比:就像给大脑装上“遥控器”,可以直接用思维控制外部设备。
2. 量子机器学习
做什么:利用量子计算的并行性和纠缠特性,加速机器学习模型的训练和推理。
例子:谷歌量子计算机在几分钟内完成传统超级计算机需数月的神经网络训练
类比:就像用超级计算机替代普通电脑,量子计算为机器学习带来指数级加速。
3. 生物计算
做什么:通过模拟生物系统的信息处理机制,实现高效、低功耗的计算。
例子:基于DNA存储和分子逻辑门的生物计算体系,在基因测序中效率提升40%
类比:就像用生物细胞代替电子元件,生物计算为计算技术开辟新路径。
3. 人类共存
1. 增强智能
做什么:通过人机协作,提升人类的认知能力和决策效率。
例子:AI辅助医生进行诊断,提供个性化治疗方案,提升医疗效率
类比:就像给人类装上“智能助手”,帮助完成复杂任务。
2. 数字永生
做什么:通过将人类意识数字化并上传至云端,实现“数字永生”。
例子:科学家预测2030年实现意识上传,数字意识可在虚拟世界中继续“生活”
类比:就像将人类的“灵魂”保存在计算机中,实现生命的延续。
3. 伦理框架
做什么:制定伦理规范,确保AI技术的发展符合人类价值观和社会利益。
例子:全球AI治理框架的建立,确保AI在医疗、金融等领域的负责任应用
类比 :就像为AI技术设立“交通规则”,确保其在正确的轨道上运行。