导图社区人工智能-LH1.2

人工智能-LH1.2

人工智能的发展历史，人工智能主要在哪些技术领域会有大的突破和应用，及现实中有哪些领域的解决方案目前会涉及到人工智能技术等

编辑于2022-03-12 11:46:08

人智能的…

李宏

他的近期作品查看更多>>

人工智能-LH1.2
人工智能的发展历史，人工智能主要在哪些技术领域会有大的突破和应用，及现实中有哪些领域的解决方案目前会涉及到人工智能技术等
掌握数据可视化的基本技巧
这是一篇关于掌握数据可视化的基本技巧的思维导图。什么是数据可视化？就是把数据做成图表的形式，更容易让人看。数字越多，用图展示效果越好。
电商数据分析-PC-1611804024
这是一篇关于电商数据分析-PC-1611804024的思维导图。身为电商却看不懂电商平台各种指标？这就是导致电商经营困难，顾客少，收入低的原因啦。电商平台各项指标至关重要，一张思维导图帮你理清他们，快快学习起来吧。图中包括风险控制指标，总体运营指标市场竞争指标，营销活动指标等讲解。学会看懂这些，轻松掌握顾客喜好，市场走向，应对每一个节日活动。做好电商不是问题。

人工智能-LH1.2

社区模板帮助中心，点此进入>>

李宏

他的近期作品查看更多>>

相似推荐
大纲

人工智能-LH

人工智能历史

诞生（1943-1956）

图灵测试

达特矛斯会议

第一次热潮（1950-1970）

符号主义

早期推理系统

早期神经网络

专家系统

第二次热潮 (1980-2000)

统计学派

机器学习

神经网络

第三次热潮（2006年以后）

大数据广泛应用

深度学习

（非深度）机器学习

AlphaGo

高校的人工智能专业未来会怎么样？

自2017年起，就有很多高校相继成立了人工智能学院。比如，中国科学院大学、中山大学等，北京邮电大学也在2020年1月7日成立了人工智能学院。同时，也有很多高校开设了人工智能相关专业。比如，在2019年时就总共只有35所大学真正开设了纯粹的人工智能专业但在2020年教育部公布的《2019年度普通高等学校本科专业备案和审批结果》中，又有180所大学新增了人工智能专业。而最近，教育部公布了2020年度普通高等学校本科专业备案和审批结果中。又有130所高校新增了人工智能专业。所以，目前保守估计，已经累计有超过300多所专业开设了纯粹的人工智能专业。而开设人工智能相关专业，比如，大数据、数据科学与大数据技术、智能制造工程等，特别是数据科学与大数据技术的高校，那就更多了。在2019年3月份时，就已经有479所大学开设了数据科学与大数据技术专业。

人工智能专业会不会成为下一个所谓的天坑专业呢？

作为一个比较“新型”的专业方向，随着越来越多的考生报考，就业可能会存在不少问题。这个专业方向所涉及学科较多，比如数学、计算机、自动化控制等等。所以，需要学习的内容很多，同时，也需要丰富的经验积累，才可能胜任一项工作。这就导致学习周期很长，大学本科，可能只能算是入门。这就导致很多企业招人，都喜欢招这方面的硕士乃至于博士研究生，而不会招本科生或者专科生。企业招不到合适的人，而毕业生又找不到工作，或者说，企业对高精端人才的需求量不断增加，而低学历的毕业生却越来越多。

要不要选择这个专业呢？

今天出现了一个新的算法，明天出现了一个高效的机器模型，你都得及时更新你的知识，跟得上节奏才行。除此之外，前面也说了，这个行业的学习周期会很长，可能本科毕业还不够，还需要读研读博，需要不断积累项目经验。至少高学历从业者待遇还是很不错的。但是，如果你学习能力一般，并且，对相关专业兴趣并不大，不太建议你直接去学这个专业

人工智能是如何被发明的？

神经元染色技术

很长时间以来，我们对人脑的认识都停留在想象阶段，直到19世纪70年代神经元染色技术的出现才开启了现代神经科学。人脑中有1000亿个神经元，这个数量超过整个银河系所有恒星的总数。如果以集成电路作类比，2019年华为海思发布的ARM架构手机芯片“麒麟990”，晶体管数量103亿。单比复杂度，手机芯片刚勉强达到人脑十分之一的水平。

大脑的底层原理——神经网络

每个神经元平均有5000个突触连接着其他神经元，每秒可产生约1000个脉冲信号。如果把每次神经信号传输等价为一次“计算”的话，人脑的最大计算能力是50亿亿次，换算成衡量CPU性能的每秒浮点运算次数（FLOPS），相当于5亿GFLOPS。就算世界排名第一的超级计算机——“天河二号”5000万GFLOPS的恐怖算力，也只有人脑的十分之一。大脑中不同的数据分布在千亿个神经元组成的庞大网络中，彼此之间相互连接，这就是大脑的底层原理——神经网络。

神经元的结构很简单，中间一只球形的细胞体，一头长出许多细小而茂盛的神经纤维分支（称为树突），用来接收其他神经元传来的信号，另一头伸出一根长长的突起纤维（称为轴突），用来把自己的信号传给别人。神经元运作的原理可以抽象为一个水桶，当树突灌进足够多的水（信号），使得水位上升到足够高（阈值）时，轴突这根水管才会喷发出水来（激发），而喷出来的水流进了下一只水桶（传输）。射完后，水位突然下降，要休息一段时间才能再次喷射（不应期）。用计算机也可以模拟神经网络模型，哪怕一个神经元也可以当作一个决策系统。

模拟神经网络模型

用计算机也可以模拟神经网络模型，哪怕一个神经元也可以当作一个决策系统。比如出去吃还是叫外卖，这个决策模型通常取决于3个因素：下雨吗？远不远？和谁去？每个因素可以根据程度不同，用一个小数表示。比如第一项因素：X1=1.0代表晴空万里，X1=0.5是多云转小雨，X1=0代表瓢泼大雨，其他因素依次类推，最后设置阈值T=5，只要输入总和大于T值，就决定出去吃；否则就叫外卖。只要有足够的神经元，只要这些神经元组成足够多的层级，再加上恰到好处的模型参数，神经网络可以把任何输入变成任何输出。神经网络的潜力远远超出基于逻辑门电路的传统计算机。

人工智能=技术+应用

技术

语音技术

语音识别

训练语音识别语言模型，声音分类模型。提升业务领域专有名词识别准确率，区分不同声音类别，广泛适用于行业数据采集录入、语音指令、呼叫中心、声音类型检测等应用场景

短语音识别

将60秒以内的语音精准识别为文字，可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景

应用场景

语音输入

摆脱生僻字和拼音障碍，使用语音即时输入。略带口音的普通话、粤语四川话方言、英文，均可有效识别，并可根据句意自动纠错、自动断句添加标点，让输入更快捷，沟通交流更顺畅

语音搜索

搜索内容直接以语音的方式输入，应用于网页搜索、车载搜索、手机搜索等各种搜索场景，解放双手让搜索更加高效，适用于视频网站、智能硬件、手机厂商等多个行业

爱奇艺

百度

语音指令

无需手动操作，可以通过语音直接对设备或者软件发布指令，控制操作，适用于智能硬件、车载系统、机器人、手机APP、游戏等多个领域

社交聊天

社交聊天时直接用语音输入的方式转成文字，让输入更加便捷；或者在收到语音消息不适合播放时可以转为文字进行查看，满足更多的聊天场景

游戏娱乐

游戏中聊天必不可少，双手无法打字，语音输入可以将语音聊天转为文字，让用户在操作的同时也可直观看到聊天内容，多样化满足用户聊天需求

人机对话

将语音识别为文字，毫秒级响应，可用于聊天机器人、故事机等近场语音识别环境，让人机对话更加流畅自然

实时语音识别

基于Deep Peak2的端到端建模，将音频流实时识别为文字，并返回每句话的开始和结束时间，适用于长句语音输入、音视频字幕、会议等场景

应用场景

实时语音输入

语音输入准确高效，解放双手，说话内容实时展示在屏幕上，聊天顺畅

视频直播字幕

直播新玩法，主播说话可以直接将说话内容实时转写为字幕展示在屏幕上，或者可进行二次字幕编辑

演讲字幕同屏

大会演讲可以在屏幕上实时展示嘉宾演讲字幕，逐字展示并智能纠错

实时会议记录

会议场景中，每个说话人的语音可以实时记录，提升会议记录效率

课堂音频识别

对老师课堂内容实时记录，校方可以进行教学内容记录以及教学质量评估

音频文件转写

将批量上传的音频文件识别为文字，返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景

应用场景

会议访谈转写

将会议、访谈的长时间录音批量识别为文字，通过静音识别自动将有语音部分进行切分，提升识别效率，便于进行内容记录、总结，提升音频内容记录效率

音频内容分析

将大量对话录音识别为文字，并对内容进行持续分析与监控，及时发现风险、违规内容，发掘潜在问题

课堂录音分析

将课堂录音文件进行识别，通过文字，还原课堂场景，分析教学内容，提升教学质量

视频字幕

将视频中的音频进行语音识别，自动切分无语音部分，对每句话标记时间戳，通过时间戳生成对应字幕，提升配置字幕效率

语音合成

在线合成

离线语音合成

在无网或弱网环境下，可在手机APP或故事机、机器人等智能硬件设备终端进行语音播报，将文字合成为声音

应用场景

阅读听书

使用语音合成技术的阅读类APP，能够为用户提供多种音库的朗读功能，释放用户的双手和双眼，提供更极致的阅读体验

资讯播报

提供专为新闻资讯播报场景打造的特色音库，让手机、音箱等设备化身专业主播，随时随地为用户播报新鲜资讯

订单播报

可应用于打车软件、餐饮叫号、排队软件等场景，通过语音合成进行订单播报，让您便捷获得通知信息

嘀嗒出行

智能硬件

可集成到儿童故事机、智能机器人、平板设备等智能硬件设备，使用户与设备的交互更自然、更亲切

语音唤醒

支持特定语音指令唤醒，唤醒的同时执行指令操作语音唤醒技术通过在设备或软件中预置唤醒词，当用户发出该语音指令时，设备便从休眠状态中被唤醒，并作出指定响应，大大提升了人机交互的效率

应用场景

智能硬件唤醒

相机类：拍照、茄子

音乐类：增大音量、减小音量、播放、停止、暂停、上一首、下一首

电灯类：打开电灯、关闭电灯、增大亮度、减小亮度

手电筒类：打开手电筒、关闭手电筒

车载应用唤醒

语音翻译AI同传高级语音识别及转换

应用场景

国际会议

适用于邀请国外嘉宾演讲或参会的行业/学术会议

讲座培训

适用于邀请国外专家讲座或国内专家对外籍工作人员的培训，如人工智能、技术、医疗等领域的讲座培训

企业会议

适用于跨国公司内部的季度会、分享会和工作会议，随时随地快速接入同传服务，帮助中外员工理解会议内容，让信息传达更高效

呼叫中心语音

应用场景

语音机器人

代替传统人工进行电话外呼、回访、通知，将企业呼叫中心标准的业务通过机器人与用户的对话完成，高仿真模拟真人坐席，大幅节约人力成本。

坐席智能话术提示

在电话销售场景中，通过识别分析对话，向电销坐席实时推荐话术，提升成单率；在客服场景中可辅助坐席快速反馈用户疑问。

智能语音质检及多维建模

在用户与坐席通话中或通话后，机器人识别双方语音、理解语义，并按业务要求分析给出质检结果，实现全量自动化智能质检

电话客服质检

通过对客服录音文件进行批量识别，辅助人工进行质检，实现全量自动化智能质检，提升坐席服务水平，提高客户满意度

电话录音内容分析

将大量对话录音识别为文字，并对内容进行持续分析，发掘潜在营销机会，建立用户画像

电话对话内容还原

将大量对话录音文件，转为文字。还原及展示对话流程，还原对话场景

图像技术

车辆分析

车型识别

车辆检测

识别图像中所有车辆的类型和位置，并对小汽车、卡车、巴士、摩托车、三轮车5类车辆分别计数，同时可定位小汽车、卡车、巴士的车牌位置

车流统计

根据视频抓拍图片序列，进行车辆检测和追踪，识别各类车辆（包括小汽车、卡车、巴士、摩托车、三轮车）在指定区域内的驶入、驶出数量，实现动态车流统计

车辆属性识别

车辆外观损伤识别

车辆分割

检测图像中的车辆，以小汽车为主，识别车辆的轮廓范围，与背景进行分离，返回分割后的二值图、灰度图，适应多个车辆、车门开启、各种角度

应用场景

拍照识车

根据拍摄照片，快速识别图片中车辆的品牌型号，提供针对性的信息或服务，可用于相册管理、图片分类打标签、电子汽车说明书、一键拍照租车等场景

违章停车监测

监控分析城市道路、园区/厂区等公共场所的车辆停放情况，判断核心区域是否有违章停车，并进一步识别违章车辆的车牌号码、品牌型号，实现自动化的违章审计

智能卡口

监控高速路闸口、停车场出入口的进出车辆，基于车牌、车型、车辆属性等信息对车辆身份进行识别校验，实现无卡、无人的智能化卡口管理，提升通行效率

路况分析

实时监控交通道路、卡口的车流量，自动统计不同时段各类车辆的进出车流量，分析路口、路段的交通状况，为交通调度、路况优化提供精准参考依据

智能定损

车主或定损员通过手机拍摄上传车辆损伤部位的外观图片，自动识别受损部件及损伤类型，快速在线定损，并可推荐引导至周边4S店/汽修店，显著提升小额案件的定损、理赔效率

车况审计

租车或者共享汽车，对汽车使用前后分别拍摄车身照片，进行识别、对比，分析判断汽车使用过程中是否发生了损伤，以及具体的损伤情况，辅助车况验证，节省人力成本，减少风险损失

汽车抠图

从实拍图中自动分割出汽车图像，实现自动批量抠图，可进一步对背景图像进行替换、合成、虚化处理，用于新车、二手车宣传图制作等

对象识别

图像识别

通用物体与场景识别

图像主体监测

动物识别

植物识别

果蔬识别

菜品识别

应用场景

餐饮健康

根据拍摄照片，识别图片中菜品名称，获取菜品参考卡路里含量和百科信息，可结合识别结果进一步提供饮食推荐、健康管理方案等相关功能，增强用户体验，广泛应用于餐饮娱乐类和健康管理类APP中

智能结算

根据拍摄照片，识别图片中菜品名称和位置，提高结算效率，减少人工录入成本，广泛应用于餐饮行业中

地标识别

货币识别

图像审核

基于深度学习的智能内容审核方案，准确过滤图像和视频中的色情、暴恐、政治敏感、广告、恶心、不良场景等违规内容，也能从美观、清晰等维度对图像进行筛选，紧贴业务需求，释放审核人力

色情识别

智能识别图像中的色情和性感内容，包含各类色情违禁、儿童裸露、女性性感、艺术品色情等

暴恐识别

检测图像中是否包含暴恐旗帜、恐怖组织头目、军事武器、暴力及血腥场景等涉嫌违禁的内容

旗帜标志识别

检测图像中是否包含国旗国徽、党旗党徽、警徽、臂章以及反动组织的各类旗帜和标志

政治人物识别

检测图像中是否包含政治人物和敏感政治事件场景，帮助业务规避相关风险

公众人物识别

公众人物，包括歌星、演员、运动员、政要等

用户头像审核

对图像中人脸的角度、遮挡、占比、清晰度等进行审核，筛选适合作为头像的照片

广告检测

检测图片中是否包含水印、二维码、条形码、小程序码，帮助过滤各种微商广告

图文审核

综合应用文字识别和文本审核技术，对图像中的文字内容进行多维度审核，检测图像中的文字是否包含色情、政治敏感、广告等违规内容

恶心图像识别

检测图像中是否包含尸体、解剖、昆虫类、生理病变等恶心、令人不适的内容

图像质量检测

对图像的清晰度和美观度进行打分，检测图像色彩、构图及是否存在模糊、失焦、噪点、锯齿、马赛克等情况

不良场景识别

识别图像中是否包含吸烟、饮酒、赌博、吸毒等不良行为

自定义图像审核

定制图像分类、物体检测等模型，自定义识别标签，满足个性化审核需求

BaiduAIEasyDL

应用场景

视频直播图像审核

采用色情识别、暴恐识别、政治敏感识别技术，对视频、直播的截帧图像进行实时自动审核，快速高效，过滤违规内容的同时保证良好的用户体验

社交应用图像审核

在社交应用中大量的色情，暴力，政治敏感图片，让应用面临监管风险。接入图像审核服务，对实时聊天中的敏感图像进行高效过滤审核，降低业务违规风险

社区论坛图像审核

对社区、论坛、贴吧等平台中的图像进行审核，过滤色情、暴恐、政治敏感、恶意推广等内容，降低平台违规风险、提升平台内容质量，吸引更多用户与优质资源

用户头像审核

针对用户头像进行多维度的图像审核，对图像中人脸的角度、遮挡、占比、清晰度等进行审核，确保图像中包含清晰人物正脸、非明星/卡通人脸，并且无色情、暴恐、政治敏感、微商广告、各类联系方式内容，筛选适合作为头像的照片，保障用户使用体验

图像搜索

以图搜图，在指定图库中搜索出相同或相似的图片，适用于图片精确查找、相似素材搜索、拍照搜同款商品、相似商品推荐等场景

相似图片搜索

在自建图库中找到与检索图片语义相似的图片集，并给出相似度打分（综合图片类型、颜色、内容、布局等特征）；适用于各种相似图片查找、相关内容推荐场景

相同图片搜索

在自建图库中找到与检索图相同的图片，支持找到局部内容相同的大图，或适度调整背景和角度的相同图片；可用于图片精确查找、重复图片过滤等场景

商品图片搜索

针对商品类图片，专项训练检索模型，在自建图库中搜索相同及相似的商品图片集，可找到不同颜色、背景、角度的同款商品；适用于电商平台拍照搜商品等场景

绘本图片搜索

针对拍照搜童书场景专项优化算法，支持用局部绘本页面图片，精准检索自建库中对应儿童书本教材。可应用于儿童绘本、教材书本的“拍照搜书”场景，辅助实现绘本跟读、教材讲解等功能。

应用场景

设计素材查找

基于拍摄照片查找相似或相同的图片作品，满足设计师人群、工作人员更快捷高效查找原版大图或相似作品的需求

商品搜索及推荐

将用户拍摄的图片在商品库中搜索，找到同款或相似的商品，进行商品销售或者相关商品推荐，提升搜索查找的便捷性，优化用户体验