导图社区 人工智能-LH1.2
人工智能的发展历史,人工智能主要在哪些技术领域会有大的突破和应用,及现实中有哪些领域的解决方案目前会涉及到人工智能技术等
编辑于2022-03-12 11:46:08人工智能的发展历史,人工智能主要在哪些技术领域会有大的突破和应用,及现实中有哪些领域的解决方案目前会涉及到人工智能技术等
这是一篇关于掌握数据可视化的基本技巧的思维导图。什么是数据可视化?就是把数据做成图表的形式,更容易让人看。数字越多,用图展示效果越好。
这是一篇关于电商数据分析-PC-1611804024的思维导图。身为电商却看不懂电商平台各种指标?这就是导致电商经营困难,顾客少,收入低的原因啦。电商平台各项指标至关重要,一张思维导图帮你理清他们,快快学习起来吧。图中包括风险控制指标,总体运营指标市场竞争指标,营销活动指标等讲解。学会看懂这些,轻松掌握顾客喜好,市场走向,应对每一个节日活动。做好电商不是问题。
社区模板帮助中心,点此进入>>
人工智能的发展历史,人工智能主要在哪些技术领域会有大的突破和应用,及现实中有哪些领域的解决方案目前会涉及到人工智能技术等
这是一篇关于掌握数据可视化的基本技巧的思维导图。什么是数据可视化?就是把数据做成图表的形式,更容易让人看。数字越多,用图展示效果越好。
这是一篇关于电商数据分析-PC-1611804024的思维导图。身为电商却看不懂电商平台各种指标?这就是导致电商经营困难,顾客少,收入低的原因啦。电商平台各项指标至关重要,一张思维导图帮你理清他们,快快学习起来吧。图中包括风险控制指标,总体运营指标市场竞争指标,营销活动指标等讲解。学会看懂这些,轻松掌握顾客喜好,市场走向,应对每一个节日活动。做好电商不是问题。
人工智能-LH
人工智能历史
诞生 (1943-1956)
图灵测试
达特矛斯会议
第一次热潮 (1950-1970)
符号主义
早期推理系统
早期神经网络
专家系统
第二次热潮 (1980-2000)
统计学派
机器学习
神经网络
第三次热潮 (2006年以后)
大数据广泛应用
深度学习
(非深度)机器学习
AlphaGo
高校的人工智能专业未来会怎么样?
自2017年起,就有很多高校相继成立了人工智能学院。 比如,中国科学院大学、中山大学等,北京邮电大学也在2020年1月7日成立了人工智能学院。 同时,也有很多高校开设了人工智能相关专业。比如,在2019年时就总共只有35所大学真正开设了纯粹的人工智能专业 但在2020年教育部公布的《2019年度普通高等学校本科专业备案和审批结果》中,又有180所大学新增了人工智能专业。 而最近,教育部公布了2020年度普通高等学校本科专业备案和审批结果中。又有130所高校新增了人工智能专业。 所以,目前保守估计,已经累计有超过300多所专业开设了纯粹的人工智能专业。 而开设人工智能相关专业,比如,大数据、数据科学与大数据技术、智能制造工程等,特别是数据科学与大数据技术的高校,那就更多了。 在2019年3月份时,就已经有479所大学开设了数据科学与大数据技术专业。
人工智能专业会不会成为下一个所谓的天坑专业呢?
作为一个比较“新型”的专业方向,随着越来越多的考生报考,就业可能会存在不少问题。 这个专业方向所涉及学科较多,比如数学、计算机、自动化控制等等。 所以,需要学习的内容很多,同时,也需要丰富的经验积累,才可能胜任一项工作。 这就导致学习周期很长,大学本科,可能只能算是入门。 这就导致很多企业招人,都喜欢招这方面的硕士乃至于博士研究生,而不会招本科生或者专科生。 企业招不到合适的人,而毕业生又找不到工作,或者说,企业对高精端人才的需求量不断增加,而低学历的毕业生却越来越多。
要不要选择这个专业呢?
今天出现了一个新的算法,明天出现了一个高效的机器模型,你都得及时更新你的知识,跟得上节奏才行。 除此之外,前面也说了,这个行业的学习周期会很长,可能本科毕业还不够,还需要读研读博,需要不断积累项目经验。至少高学历从业者待遇还是很不错的。 但是,如果你学习能力一般,并且,对相关专业兴趣并不大,不太建议你直接去学这个专业
人工智能是如何被发明的?
神经元染色技术
很长时间以来,我们对人脑的认识都停留在想象阶段,直到19世纪70年代神经元染色技术的出现才开启了现代神经科学。 人脑中有1000亿个神经元,这个数量超过整个银河系所有恒星的总数。如果以集成电路作类比,2019年华为海思发布的ARM架构手机芯片“麒麟990”,晶体管数量103亿。 单比复杂度,手机芯片刚勉强达到人脑十分之一的水平。
大脑的底层原理——神经网络
每个神经元平均有5000个突触连接着其他神经元,每秒可产生约1000个脉冲信号。 如果把每次神经信号传输等价为一次“计算”的话,人脑的最大计算能力是50亿亿次,换算成衡量CPU性能的每秒浮点运算次数(FLOPS),相当于5亿GFLOPS。 就算世界排名第一的超级计算机——“天河二号”5000万GFLOPS的恐怖算力,也只有人脑的十分之一。 大脑中不同的数据分布在千亿个神经元组成的庞大网络中,彼此之间相互连接,这就是大脑的底层原理——神经网络。
神经元的结构很简单,中间一只球形的细胞体,一头长出许多细小而茂盛的神经纤维分支(称为树突),用来接收其他神经元传来的信号,另一头伸出一根长长的突起纤维(称为轴突),用来把自己的信号传给别人。 神经元运作的原理可以抽象为一个水桶,当树突灌进足够多的水(信号),使得水位上升到足够高(阈值)时,轴突这根水管才会喷发出水来(激发),而喷出来的水流进了下一只水桶(传输)。射完后,水位突然下降,要休息一段时间才能再次喷射(不应期)。 用计算机也可以模拟神经网络模型,哪怕一个神经元也可以当作一个决策系统。
模拟神经网络模型
用计算机也可以模拟神经网络模型,哪怕一个神经元也可以当作一个决策系统。 比如出去吃还是叫外卖,这个决策模型通常取决于3个因素:下雨吗?远不远?和谁去?每个因素可以根据程度不同,用一个小数表示。 比如第一项因素:X1=1.0代表晴空万里,X1=0.5是多云转小雨,X1=0代表瓢泼大雨,其他因素依次类推,最后设置阈值T=5,只要输入总和大于T值,就决定出去吃;否则就叫外卖。 只要有足够的神经元,只要这些神经元组成足够多的层级,再加上恰到好处的模型参数,神经网络可以把任何输入变成任何输出。神经网络的潜力远远超出基于逻辑门电路的传统计算机。
人工智能=技术+应用
技术
语音技术
语音识别
训练语音识别语言模型,声音分类模型。 提升业务领域专有名词识别准确率,区分不同声音类别,广泛适用于行业数据采集录入、语音指令、呼叫中心、声音类型检测等应用场景
短语音识别
将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景
应用场景
语音输入
摆脱生僻字和拼音障碍,使用语音即时输入。略带口音的普通话、粤语四川话方言、英文,均可有效识别,并可根据句意自动纠错、自动断句添加标点,让输入更快捷,沟通交流更顺畅
语音搜索
搜索内容直接以语音的方式输入,应用于网页搜索、车载搜索、手机搜索等各种搜索场景,解放双手让搜索更加高效,适用于视频网站、智能硬件、手机厂商等多个行业
爱奇艺
百度
语音指令
无需手动操作,可以通过语音直接对设备或者软件发布指令,控制操作,适用于智能硬件、车载系统、机器人、手机APP、游戏等多个领域
社交聊天
社交聊天时直接用语音输入的方式转成文字,让输入更加便捷;或者在收到语音消息不适合播放时可以转为文字进行查看,满足更多的聊天场景
游戏娱乐
游戏中聊天必不可少,双手无法打字,语音输入可以将语音聊天转为文字,让用户在操作的同时也可直观看到聊天内容,多样化满足用户聊天需求
人机对话
将语音识别为文字,毫秒级响应,可用于聊天机器人、故事机等近场语音识别环境,让人机对话更加流畅自然
实时语音识别
基于Deep Peak2的端到端建模,将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景
应用场景
实时语音输入
语音输入准确高效,解放双手,说话内容实时展示在屏幕上,聊天顺畅
视频直播字幕
直播新玩法,主播说话可以直接将说话内容实时转写为字幕展示在屏幕上,或者可进行二次字幕编辑
演讲字幕同屏
大会演讲可以在屏幕上实时展示嘉宾演讲字幕,逐字展示并智能纠错
实时会议记录
会议场景中,每个说话人的语音可以实时记录,提升会议记录效率
课堂音频识别
对老师课堂内容实时记录,校方可以进行教学内容记录以及教学质量评估
音频文件转写
将批量上传的音频文件识别为文字,返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景
应用场景
会议访谈转写
将会议、访谈的长时间录音批量识别为文字,通过静音识别自动将有语音部分进行切分,提升识别效率,便于进行内容记录、总结,提升音频内容记录效率
音频内容分析
将大量对话录音识别为文字,并对内容进行持续分析与监控,及时发现风险、违规内容,发掘潜在问题
课堂录音分析
将课堂录音文件进行识别,通过文字,还原课堂场景,分析教学内容,提升教学质量
视频字幕
将视频中的音频进行语音识别,自动切分无语音部分,对每句话标记时间戳,通过时间戳生成对应字幕,提升配置字幕效率
语音合成
在线合成
离线语音合成
在无网或弱网环境下,可在手机APP或故事机、机器人等智能硬件设备终端进行语音播报,将文字合成为声音
应用场景
阅读听书
使用语音合成技术的阅读类APP,能够为用户提供多种音库的朗读功能,释放用户的双手和双眼,提供更极致的阅读体验
资讯播报
提供专为新闻资讯播报场景打造的特色音库,让手机、音箱等设备化身专业主播,随时随地为用户播报新鲜资讯
订单播报
可应用于打车软件、餐饮叫号、排队软件等场景,通过语音合成进行订单播报,让您便捷获得通知信息
嘀嗒出行
智能硬件
可集成到儿童故事机、智能机器人、平板设备等智能硬件设备,使用户与设备的交互更自然、更亲切
语音唤醒
支持特定语音指令唤醒,唤醒的同时执行指令操作 语音唤醒技术通过在设备或软件中预置唤醒词,当用户发出该语音指令时,设备便从休眠状态中被唤醒,并作出指定响应,大大提升了人机交互的效率
应用场景
智能硬件唤醒
相机类:拍照、茄子
音乐类:增大音量、减小音量、播放、停止、暂停、上一首、下一首
电灯类:打开电灯、关闭电灯、增大亮度、减小亮度
手电筒类:打开手电筒、关闭手电筒
车载应用唤醒
语音翻译AI同传 高级语音识别及转换
应用场景
国际会议
适用于邀请国外嘉宾演讲或参会的行业/学术会议
讲座培训
适用于邀请国外专家讲座或国内专家对外籍工作人员的培训,如人工智能、技术、医疗等领域的讲座培训
企业会议
适用于跨国公司内部的季度会、分享会和工作会议,随时随地快速接入同传服务,帮助中外员工理解会议内容,让信息传达更高效
呼叫中心语音
应用场景
语音机器人
代替传统人工进行电话外呼、回访、通知,将企业呼叫中心标准的业务通过机器人与用户的对话完成,高仿真模拟真人坐席,大幅节约人力成本。
坐席智能话术提示
在电话销售场景中,通过识别分析对话,向电销坐席实时推荐话术,提升成单率;在客服场景中可辅助坐席快速反馈用户疑问。
智能语音质检及多维建模
在用户与坐席通话中或通话后,机器人识别双方语音、理解语义,并按业务要求分析给出质检结果,实现全量自动化智能质检
电话客服质检
通过对客服录音文件进行批量识别,辅助人工进行质检,实现全量自动化智能质检,提升坐席服务水平,提高客户满意度
电话录音内容分析
将大量对话录音识别为文字,并对内容进行持续分析,发掘潜在营销机会,建立用户画像
电话对话内容还原
将大量对话录音文件,转为文字。还原及展示对话流程,还原对话场景
图像技术
车辆分析
车型识别
车辆检测
识别图像中所有车辆的类型和位置,并对小汽车、卡车、巴士、摩托车、三轮车5类车辆分别计数,同时可定位小汽车、卡车、巴士的车牌位置
车流统计
根据视频抓拍图片序列,进行车辆检测和追踪,识别各类车辆(包括小汽车、卡车、巴士、摩托车、三轮车)在指定区域内的驶入、驶出数量,实现动态车流统计
车辆属性识别
车辆外观损伤识别
车辆分割
检测图像中的车辆,以小汽车为主,识别车辆的轮廓范围,与背景进行分离,返回分割后的二值图、灰度图,适应多个车辆、车门开启、各种角度
应用场景
拍照识车
根据拍摄照片,快速识别图片中车辆的品牌型号,提供针对性的信息或服务,可用于相册管理、图片分类打标签、电子汽车说明书、一键拍照租车等场景
违章停车监测
监控分析城市道路、园区/厂区等公共场所的车辆停放情况,判断核心区域是否有违章停车,并进一步识别违章车辆的车牌号码、品牌型号,实现自动化的违章审计
智能卡口
监控高速路闸口、停车场出入口的进出车辆,基于车牌、车型、车辆属性等信息对车辆身份进行识别校验,实现无卡、无人的智能化卡口管理,提升通行效率
路况分析
实时监控交通道路、卡口的车流量,自动统计不同时段各类车辆的进出车流量,分析路口、路段的交通状况,为交通调度、路况优化提供精准参考依据
智能定损
车主或定损员通过手机拍摄上传车辆损伤部位的外观图片,自动识别受损部件及损伤类型,快速在线定损,并可推荐引导至周边4S店/汽修店,显著提升小额案件的定损、理赔效率
车况审计
租车或者共享汽车,对汽车使用前后分别拍摄车身照片,进行识别、对比,分析判断汽车使用过程中是否发生了损伤,以及具体的损伤情况,辅助车况验证,节省人力成本,减少风险损失
汽车抠图
从实拍图中自动分割出汽车图像,实现自动批量抠图,可进一步对背景图像进行替换、合成、虚化处理,用于新车、二手车宣传图制作等
对象识别
图像识别
通用物体与场景识别
图像主体监测
动物识别
植物识别
果蔬识别
菜品识别
应用场景
餐饮健康
根据拍摄照片,识别图片中菜品名称,获取菜品参考卡路里含量和百科信息,可结合识别结果进一步提供饮食推荐、健康管理方案等相关功能,增强用户体验,广泛应用于餐饮娱乐类和健康管理类APP中
智能结算
根据拍摄照片,识别图片中菜品名称和位置,提高结算效率,减少人工录入成本,广泛应用于餐饮行业中
地标识别
货币识别
图像审核
基于深度学习的智能内容审核方案,准确过滤图像和视频中的色情、暴恐、政治敏感、广告、恶心、不良场景等违规内容,也能从美观、清晰等维度对图像进行筛选,紧贴业务需求,释放审核人力
色情识别
智能识别图像中的色情和性感内容,包含各类色情违禁、儿童裸露、女性性感、艺术品色情等
暴恐识别
检测图像中是否包含暴恐旗帜、恐怖组织头目、军事武器、暴力及血腥场景等涉嫌违禁的内容
旗帜标志识别
检测图像中是否包含国旗国徽、党旗党徽、警徽、臂章以及反动组织的各类旗帜和标志
政治人物识别
检测图像中是否包含政治人物和敏感政治事件场景,帮助业务规避相关风险
公众人物识别
公众人物,包括歌星、演员、运动员、政要等
用户头像审核
对图像中人脸的角度、遮挡、占比、清晰度等进行审核,筛选适合作为头像的照片
广告检测
检测图片中是否包含水印、二维码、条形码、小程序码,帮助过滤各种微商广告
图文审核
综合应用文字识别和文本审核技术,对图像中的文字内容进行多维度审核,检测图像中的文字是否包含色情、政治敏感、广告等违规内容
恶心图像识别
检测图像中是否包含尸体、解剖、昆虫类、生理病变等恶心、令人不适的内容
图像质量检测
对图像的清晰度和美观度进行打分,检测图像色彩、构图及是否存在模糊、失焦、噪点、锯齿、马赛克等情况
不良场景识别
识别图像中是否包含吸烟、饮酒、赌博、吸毒等不良行为
自定义图像审核
定制图像分类、物体检测等模型,自定义识别标签,满足个性化审核需求
BaiduAIEasyDL
应用场景
视频直播图像审核
采用色情识别、暴恐识别、政治敏感识别技术,对视频、直播的截帧图像进行实时自动审核,快速高效,过滤违规内容的同时保证良好的用户体验
社交应用图像审核
在社交应用中大量的色情,暴力,政治敏感图片,让应用面临监管风险。接入图像审核服务,对实时聊天中的敏感图像进行高效过滤审核,降低业务违规风险
社区论坛图像审核
对社区、论坛、贴吧等平台中的图像进行审核,过滤色情、暴恐、政治敏感、恶意推广等内容,降低平台违规风险、提升平台内容质量,吸引更多用户与优质资源
用户头像审核
针对用户头像进行多维度的图像审核,对图像中人脸的角度、遮挡、占比、清晰度等进行审核,确保图像中包含清晰人物正脸、非明星/卡通人脸,并且无色情、暴恐、政治敏感、微商广告、各类联系方式内容,筛选适合作为头像的照片,保障用户使用体验
图像搜索
以图搜图,在指定图库中搜索出相同或相似的图片,适用于图片精确查找、相似素材搜索、拍照搜同款商品、相似商品推荐等场景
相似图片搜索
在自建图库中找到与检索图片语义相似的图片集,并给出相似度打分(综合图片类型、颜色、内容、布局等特征);适用于各种相似图片查找、相关内容推荐场景
相同图片搜索
在自建图库中找到与检索图相同的图片,支持找到局部内容相同的大图,或适度调整背景和角度的相同图片;可用于图片精确查找、重复图片过滤等场景
商品图片搜索
针对商品类图片,专项训练检索模型,在自建图库中搜索相同及相似的商品图片集,可找到不同颜色、背景、角度的同款商品;适用于电商平台拍照搜商品等场景
绘本图片搜索
针对拍照搜童书场景专项优化算法,支持用局部绘本页面图片,精准检索自建库中对应儿童书本教材。可应用于儿童绘本、教材书本的“拍照搜书”场景,辅助实现绘本跟读、教材讲解等功能。
应用场景
设计素材查找
基于拍摄照片查找相似或相同的图片作品,满足设计师人群、工作人员更快捷高效查找原版大图或相似作品的需求
商品搜索及推荐
将用户拍摄的图片在商品库中搜索,找到同款或相似的商品,进行商品销售或者相关商品推荐,提升搜索查找的便捷性,优化用户体验
相关内容推荐
将文章内容或者产品服务中的图片入库,通过比对用户上传的图片,查找相似图片,从而找到相关的内容信息,实现相关内容搜索、推荐
拍照搜书
进行儿童绘本、教材书本的“拍照搜书”,儿童通过学习机、pad等设备拍摄绘本、书本的照片,在学习库中自动检索出对应的封面或者书页,实现绘本跟读、教材讲解等功能
商品识别
将商品名称与图片相匹配一起入库,通过图片相似度判断实现指定集合内的商品识别,可用于户外广告拍照下单、供应链系统拍图找货等场景
重复图片过滤
搜索图库中是否有相同或高度相似的图片,实现系统内图片去重或过滤,避免重复内容引起的资源浪费、体验下降等问题
图像效果增强
基于领深度学习技术, 对质量较低的图片进行去雾、对比度增强、无损放大、拉伸恢复等 多种优化处理,重建高清图像
图像去雾
对浓雾天气下拍摄, 导致细节无法辨认的图像进行去雾处理, 还原更清晰真实的图像
图像对比度增强
调整过暗或者过亮图像的对比度, 使图像更加鲜明
图像无损放大
将图像在长宽方向各放大两倍, 保持图像质量无损
拉伸图像恢复
自动识别过度拉伸的图像, 将图像内容恢复成正常比例
图像修复
图像修复 可集成到图像美化、创意处理等软件中, 对图片进行智能修复, 去除图片中不需要的物体, 并使用背景内容进行填充; 也可用于内容生产平台批量优化图像质量
图像清晰度增强
对模糊图像 实现智能快速去噪, 优化图像纹理细节, 使画面更加自然清晰
图像色彩增强
可智能调节图片的色彩饱和度、亮度、对比度, 使得图片内容细节、色彩更加逼真
应用场景
破损照片修复
开展怀旧等主题活动,用户上传破损照片,标注出破损位置,即可获得修复后的照片
视频、图片质量提升
对视频截图/封面图、网站图片进行处理,找出并修复存在过度拉伸问题的视频、图片,提升内容质量
视频监控
在安防监控/车载系统场景下,将视频关键帧/图像进行无损放大优化,重建更可辨析的监控材料,展示更多细节
彩印照片美化
帮助彩印工作室在彩印前优化处理照片,毫米级时间内即可将图片的长宽各放大两倍并保持质量无损,减轻设计师工作量
图像特效
黑白图像上色
智能识别黑白图像内容并填充色彩, 使黑白图像变得鲜活
图像风格转换
将图像转换成卡通画、铅笔画、哥特油画等多种艺术风格, 可用于开展趣味活动, 或集成到美图应用中 对图像进行风格转换
人像动漫化
运用对抗生成网络技术, 结合人脸检测、头发分割、人像分割等技术, 为用户量身定制千人千面的二次元动漫形象, 并通过参数设置,生成戴口罩的二次元动漫人像。
应用场景
抠图与美化
将原始图片中的天空区域识别并分离出来,可选择新的天空图片进行替换、合成,提供更加丰富的图片处理效果及娱乐体验
人像图片趣味处理
将自拍图像1:1 生成动漫二次元人像效果,可用于开展趣味h5活动或者集成到相册、美图应用等,用户只需上传人脸图片,即可立刻获得千人千面的动漫人像
美颜相机
可集成到美颜相机、相册、美图应用中,将用户拍摄的图片转换成各种艺术、漫画、二次元风格等,增加趣味性,丰富相机特效能力
文字识别
通用场景文字识别
通用文字识别
网络图片文字识别
办公文档识别
数字识别
手写文字识别
表格文字识别
二维码识别
卡证文字识别
身份证识别
银行卡识别
营业执照识别
名片识别
护照识别
户口本识别
港澳通行证识别
台湾通行证识别
出生医学证明识别
多卡证类别检测
财务票据文字识别
混贴票据识别
银行回单识别
增值税发票识别
定额发票识别
通用机打发票识别
火车票识别
出租车票识别
行程单识别
汽车票识别 邀测
通行费发票识别 邀测
通用票据识别
银行汇票识别
银行支票识别
教育场景文字识别
试卷分析与识别
公式识别
汽车场景文字识别
行驶证识别
驾驶证识别
车牌识别
VIN码识别
机动车销售发票识别
车辆合格证识别
医疗票据文字识别
医疗发票识别
医疗费用结算单识别
病案首页识别
保险单识别
智能结构化识别
结构化识别各类卡证、票据,无需配置结构化对应关系、无需提取关键词、无需定制开发,直接上传图片即可获得结构化识别信息
应用场景
卡证票据电子化
对未提供专门接口,但版式较为统一的各类卡证、票据,如房产证、不动产权证、学生证、发明专利、登机牌等进行自动结构化识别,实现各类卡证票据关键信息的读取,可应用于政务审批、证件信息录入等场景,有效降低识别模板定制成本,快速实现各种新卡证/票据的信息录入
其它文字识别
仪器仪表盘读数识别
门脸文字识别
印章识别
拍照翻译
彩票识别
人脸与人体识别
人脸识别
人脸关键点
高精度人脸关键点检测
基于高精度人脸关键点检测能力,在不同面部角度、表情及光照条件下实现稳定的面部动作检测与跟踪。
人脸检测
人脸对比
人脸搜索
活体检测
合成图检测
应用场景
人脸实名认证
刷脸闸机通行
智慧人脸考勤
智能视频监控
智能会员管理
刷脸移动支付
智能相册分类
互动娱乐美颜
人脸注册登录
人像特效
人像清晰度增强
虚拟换妆
高清人像美化
人脸三维重建算法
高精度人脸关键点检测
美妆试妆
美颜滤镜
精细化美型
美发染色
人体分析
人体关键点识别
人流量统计
人体检测与属性
3D肢体关键点
应用场景
安防监控
智能零售
驾驶监测
体育娱乐
行为分析
驾驶行为分析
危险行为识别
手部关键点识别
手势识别
指尖检测
分割抠图
五官分割
人像分割
医美特效
皮肤分析
肤色检测
发际线编辑
人脸3D模型生成
视频技术
视频内容分析
视频分类
基于对视频语音及图像的综合分析,对视频内容理解后形成分类标签
视频语音识别
基于长语音识别技术,针对视频场景优化,精准识别视频中的语音内容
视频OCR
更好的适配复杂背景,精准识别视频画面中包括字幕、标题、弹幕等关键内容
视频特定人物识别
基于百度人脸识别技术和丰富全面的公众人物库,识别视频中出现的明星、名人
视频细粒度识别
针对垂直领域单独建模,精细化识别视频中出现的物体种类、型号和详细特征
泛标签提取
基于自然语言处理,将识别结果进行多次校对和关键字提取,得到最精准的标签
应用场景
视频个性化推荐
通过视频内容分析技术,自动抽取视频内容标签,有效解决新视频冷启动推荐问题,实现个性化推荐,增加视频曝光
视频内容检索
通过视频内容分析,快速为视频生成热门标签,解决视频缺乏关键词无法露出的问题,提升用户检索体验
视频封面选取
通过对视频内容的理解,基于深度学习自动截取视频中的精彩片段或单张画面作为视频封面,提升视频的点击率和用户体验
封面质量分析
封面内容相关性
封面精彩度
输出
视频动态封面
通过分析视频中的质量、精彩程度、内容相关度,提取为Webp格式的4-8秒片段作为动态封面,吸引用户眼球,提升视频点击率
视频静态封面
基于对视频内容的充分理解,输出最具代表性的优质精彩封面,便于用户快速定位目标视频,提升视觉和检索体验
应用场景
精彩视频推荐
使用智能视频封面选图服务,快速为长/短视频选出最具代表性的高质封面,提升用户的视觉体验,便于快速筛选视频,提升用户留存
直播精彩封面图
为直播内容生成最精彩的封面,把最具吸引力的内容呈现出来,有效帮助提升直播内容的点击率,提高用户停留时长
视频对比检索
以图像精确搜索所属视频,以视频快速搜索包含相同片段的视频 支持根据图片检索其所属源视频,输出图片中源视频中出现的时间点;同时,支持根据视频检索包含相同片段的视频,并输出重叠时间起止点和重复率。可广泛应用于以图搜影,视频去重等场景
应用场景
以图搜影
区别于文本搜影,基于指定图像,快速查询其所属哪部影视剧,以及出现的时间点,帮助用户更便捷的搜索感兴趣的影视剧,提高用户体验
以影搜影
基于指定短视频,快速查询其所属哪部完整影视剧,以及出现的时间片段,方便用户查询感兴趣影视剧
视频去重
基于指定短视频,快速查询与其包含相同片段的短视频,用于视频去重,防止不同用户上传相同视频,保护版权,或规避违规视频传播
视频内容审核
针对视频内容进行多维智能审核,其中包括色情、暴恐、政治敏感、广告、自定义黑库等,让您的平台免去审核的后顾之忧
色情识别
除了对视频图像进行色情识别,还对视频中的语音、画面中的文字内容进行色情检测和过滤,其中语音色情识别属于业界首发
暴恐识别
对视频中的图像画面、语音、文字等多维内容,进行暴恐内容检测和识别,并支持自定义设置
政治敏感识别
提供政治人物库和敏感内容库,对画面中人脸、语音、文字中出现的敏感信息,实现自动检测和识别,并支持自建敏感人脸库
违禁品检测
对视频画面中的物品、文字进行检测,识别是否出现涉嫌违禁物品,包括枪支、六合彩、管制刀具等
广告检测
支持对视频中的二维码、条形码、水印进行检测和识别,同时支持对视频中的文字进行识别和广告过滤
自定义视频黑库
基于视频指纹和比对技术,支持新上传视频与自建视频黑库的指纹对比,实现防止违规视频传播、保护版权视频等业务功能
应用场景
短视频审核
短视频平台每天有大量用户上传的视频内容,通过使用视频内容审核,实现快速检测和过滤违规内容,大大减少人工审核的工作量
直播平台内容审核
应用视频内容审核服务,针对直播场景,实时的对语音、文字、画面等进行内容检测和审核,实现对主播内容的有效监管,控制业务风险
AR与VR
增强现实
虚拟形象生成驱动
基于人脸三维特征提取、自动表情基底生成、面部表情动作捕捉等算法,结合自研云渲染技术,推出低门槛、个性化虚拟形象生成与驱动解决方案
核心技术
人脸三维特征提取
从单幅彩色图片中准确提取人脸和五官(脸型、眼形、鼻形等)几何特征,实现人像特征数字化,并支持与自定义形象风格融合
自动表情基底生成
通过表情基底生成算法,为卡通头像赋予完整的表情Blendshape基底,可以被应用于多种虚拟表情系统、游戏和动画中
面部表情动作捕捉
人脸关键点组件化的优化方案,支持眼睛、嘴巴等部位的细腻表情动作捕捉,为虚拟形象提供丰富的表现力。
语音驱动表情动作
可根据文字、语音输入,精准驱动虚拟形象的唇形和面部肌肉,配合丰富的表情和动作定制,让虚拟形象更具拟真性
空间定位与显示增强
支持丰富纹理及弱纹理3D物体实时跟踪,实现从物体级至空间级的数字孪生
特效美化互动
超轻量级人机交互算法能力矩阵及完备的环境特效能力矩阵,打造优质的美颜、美妆等人像美化类产品
虚拟现实
自然语言处理
语言处理基础技术
基于领先的NLP基础模块能力, 涵盖词、短语、句子等不同粒度的底层能力, 可将其应用于多种技术和业务方向
词法分析
基于大数据和用户行为的 分词、词性标注、命名实体识别, 定位基本语言元素,消除歧义,支撑自然语言的准确理解
词向量表示
输入单个中文词语, 即可获得该词语的向量表示, 快速完成语义挖掘、 相似度计算等应用
词义相似度
依托海量优质数据和深度神经网络技术, 通过词语向量化来计算两个词之间的相似度
依存句法分析
输入中文句子, 即可自动分析文本中的依存句法结构信息, 实现对自然语言的精准理解
DNN语言模型
判断一句话是否符合语言表达习惯, 帮助您实现文本分析、纠错、对话等多种语义应用
短文本相似度
提供高精度的短文本相似度服务, 帮助快速实现推荐、检索、排序等应用
语言处理应用技术
以多场景技术应用为导向, 提供可直接应用于产品策略的NLP技术能力, 让您的产品更好地理解语言、理解用户
文本纠错
情感倾向分析
评论观点抽取
对话情绪识别
文章标签
文章分类
新闻摘要
地址识别
文本审核
色情识别
暴恐违禁
政治敏感
恶意推广
低俗辱骂
低质灌水
机器翻译
通用文本翻译
垂直领域翻译
翻译定制化训练
文档翻译
语音翻译
图片翻译
英语口语评测
AI同传
智能文档分析
依托自然语言处理、OCR、知识图谱技术,可自动提取文本关键内容,进行结构化信息识别、抽取和校审;可应用金融法律、制造通信、政府媒体、审计等文本处理场景。
结构化信息抽取
文档信息比对
文书校对审查
风险合规性
应用场景
快递单据抽取
解析并提取快递单据中文本信息,标准规范的输出结构化信息,包含姓名、电话、地址,其中地址能够自动将街道及行政区的信息补全,帮助快递或电商企业提高单据处理效率。
合同内容比对
在合同审核场景中,快速找出不同版本合同修改区域、版本差异。 同时在合同盖章归档时,有效识别实际签署的纸质合同和电子版合同差异。可应用于大中型企业、上市公司、证券、基金公司、金融机构内提升业务审核工作效率
金融保理单信息比对
结合深度学习技术在高质量金融领域标注训练,可通过结构化解析技术实现银行保理业务场景,应收账款在转融资和金融机构登记前后的信息比对
物流业单据识别
辅助物流公司的物流操作员,快速完成物流单据信息的提取和录入工作,大大节省“单证操作员”人工录入单据信息的时间
数据智能
大数据处理
大数据分析
数据仓库
搜索分析
统计与推荐
舆情分析
舆情平台
大数据风控
大数据营销
知识生产与理解
知识图谱
知识理解
基于知识图谱丰富的数据体系,提供对文本语义中实体、概念等深度理解解析能力
实体标注
结合上下文,识别文本中的实体并将其关联到百科知识库中的唯一实体对象,同时输出实体在当前上下文最合适的上位概念,以达到对文本中的实体进行辨别的作用
实体识别
从非结构化的文本中抽取命名实体,进而应用于文本理解、意图理解、舆情分析、对话NLU等任务
实体链接
基于百科知识库,将实体链接到知识库中的实体,可用于搜索、推荐、广告、对话等多种场景下的知识解析任务,进而更好的解决应用问题
应用场景
文本理解
结合百科知识库及文本上下文语境,可将文本中的实体关联到百科知识库中唯一的实体对象,达到对文本中知识消歧的作用,辅助文本理解。如:"李娜网球",会将"李娜"标注"李娜[中国女子网球名将]"
主需求识别
通过将文本的实体标注并链接到百科知识库,再抽取文本中的SPO(主语,谓语,宾语)三元组知识,可提升知识抽取的准确率
汉语检索
融合需求识别与理解、知识推理与计算等AI认知层技术,基于汉语知识图谱积累的汉语字典及问答能力,提供汉语领域的知识检索服务
汉语词典
可检索汉语的单字、词语、成语、诗词、古文、俗语歇后语、名言警句等,给出对应的拼音、笔画、释义、组词、百度百科等多个内容维度解释信息
汉语问答
根据用户的问题 给出基于汉语知识场景的解答, 例如检索“三个火念什么”、 “秋开头的成语”, 可精准输出检索结果,回答汉语客观类知识问题
应用场景
在线阅读中字词、成语检索释义
对字词、成语等 进行汉语字典检索, 即可得到对应的拼音、释义等, 满足用户无需离开当前应用 即可查询字典、获取知识的需求
儿童早教下进行的汉语知识问答
为儿童早教、诗词教育等应用 提供汉字、词语、诗词等内容的相关知识, 更可结合早教机器人进行汉语相关的问答
知识问答
基于海量数据, 对用户需求进行深层次、知识化理解, 并结合知识查询、推理、计算等多种技术, 精准满足用户需求。 为用户提供多领域、细粒度的知识问答服务
精准问答
基于结构化数据的精准问答, 可直接满足用户知识检索需求。 娱乐、人物、教育、影视、综艺、动漫、小说、文学作品等垂类
推理计算
通过对知识图谱实体属性和边关系特征的计算、推理,获得检索答案。 如日期历法、年龄差、身高差、时间时区差等垂类
通用问答
全领域通用事实性问答, 通过Query解析、 自由文本知识抽取 和文本的深度理解技术, 满足用户复杂问答需求
应用场景
智能硬件
为智能音箱、智能电视、机器人等硬件产品 提供知识问答服务。 用户可以说:“距离春节还有多少天”、 “中国国宝是什么”等
知识媒体
满足知识媒体用户对于知识获取的需求。 当用户浏览到“菊花花期”时, 点击可查看“菊花的花期是9-11月
泛娱乐
基于娱乐知识图谱, 为用户提供娱乐人物、影视作品等知识信息。 用户可以搜索:“刘德华身高”、“刘诗诗老公的年龄”等
作文检索
基于大量作文范文数据库, 提供精准体裁类别与多样化标签标记, 为日常写作指导场景, 提供多维度作文内容检索服务
实体检索
可根据作文名称进行模糊查询, 结果将给出包含搜索名称相同的优秀作文内容。 同时,正文内容中将涵盖该作文的点评内容
标签检索
根据用户提供的检索信息进行查询, 例如“描写秋天的作文”“高中议论文”等方式, 给出相关的优秀作文内容
应用场景
作文仿写
满足初级用户在作文写作时 对命题作文或限定文体类型的作文(读后感、书信、记叙文等), 进行内容的查询, 提供多篇优质作文, 参照仿写。 提高使用者以仿写训练为中心的写作能力
优秀范文学习
用户在学习写作过程中, 通过高分范文的检索及阅读, 提升自身的写作技巧, 内容包括范文布局、句子编排、特殊句式等多种写作类型。 同时包含作文内容点评,可帮助使用者更好的理解文章内容与写作技巧
事件图谱
基于业界领先的知识图谱,提供不同粒度的事件图谱底层技术,可在金融风控、智能营销、舆情监控等多个场景及业务方向应用
资讯事件判别
针对资讯标题或短句,自动判断该文本是否包含事件描述并给出相关置信度;为优质资讯需求、事件识别提供基础技术支持
事件名抽取
通过对资讯标题与正文的理解,进而自动抽取出事件名及对应的置信度,常用于新闻个性化推荐、文章聚合、内容检索等场景。
事件通用属性抽取
识别包含多个正文组成的事件资讯,可抽取事件参与者、时间、地点、事件触发词等对应的通用属性,是内容检索、文章聚合等常用技术的基础之一。
事件相似度判别
计算两个给定事件的相似度,从而判断是否同一事件的概率;常用于事件聚合、去重等应用场景。
应用场景
智能创作
智能创作平台应用多个事件图谱服务,构建事件热点发现、热点分析、事件脉络等查询工具,高效应用到媒体行业,全面提升内容创作效率
搜索资讯频道
搜索资讯频道引入盘点页识别服务,有效打压低质盘点页,提升资讯结果的质量
搜索时效性内容扩展
搜索时效性热点资讯聚合页引入事件脉络服务,可帮助用户快速了解热点事件的来龙去脉。
智能创作平台
集合领先的自然语言处理和知识图谱技术,提供自动创作和辅助创作的能力,全面提升内容创作效率,旨在成为更懂你的智能创作助手
自动创作
通过接入数据、 配置专属写作模板, 快速实现批量和自动生成文章的能力。 支持聚合写作、 关键词创作等 多种内容自动生成能力
智能春联
智能写诗
结构化数据写作
辅助创作
从素材发现、 创作工具角度, 提供热点发现、事件脉络、热词分析、文本纠错、用词润色、文本审核、文章分类、文章标签等技术
热点发现
热词分析
事件脉络
文本纠错
用词润色
自动摘要
文本审核
文章分类
文章标签
标题生成
多模态创作
提供包括图文、视频内容在内的多模态自动创作能力, 快速实现文本到视频、视频到文本的多种内容创作能力, 全面赋能内容创作
春联主题词:
应用场景
媒体与内容创作行业
适用于财经新闻、体育新闻、天气新闻、娱乐事件等多样内容的自动创作与辅助创作,大幅提升创作效率
商业智能
适用于企业内外部 数据的自动分析与报告生成, 提升企业信息同步效率与管理效率
行业报告与咨询机构
适用于对行业热点咨询、最新动态等信息的追踪、监测与报告的自动生成,大幅提升信息处理效率
市场营销与活动
运用智能写诗与智能春联的技术,帮助企业打造更多让用户有参与感的营销活动,提升营销的用户体验与传播价值
工业智能
产品外观瑕疵质检
产品智能质检, 使用AI视觉技术手段 对工业产品的外观瑕疵进行自动化识别, 软硬一体的解决方案
解决方案
应用场景
键盘外观检测
在制造和组装键盘流水线中, 自动识别键盘组装后的合格性, 包括缺件、错装、正常三类
木地板外观检测
在生产线上自动检测木地板的外观瑕疵,包括毛面、棘爪、腐朽、虫眼等瑕疵
工业喷油嘴检测
在生产线上自动检测工业喷油器阀座的外观瑕疵
纺织品针检检测
在鞋、帽、箱包等纺织品产品进行检针的过程中, 对X光拍照结果进行自动识别,检测断针、金属小物件等异物
塑料瓶检测
对医药、食品、日化等各类包装塑料瓶在生产线上进行自动检测, 包括污点、划痕、裂缝、标签错位和歪斜等外观缺陷
医药说明书检测
对各类医药产品的说明书在生产线上进行自动检测, 包括油污、字迹不清、版面错位、印刷错误等缺陷
玻璃瓶尺寸检测
在生产线上对玻璃瓶的瓶口、瓶颈、瓶身的尺寸进行实时自动检测,以及分级分类
场景应用方案
企业服务
智能零售
信息服务
智能医疗
智能工业
智能教育
智能硬件
行业应用方案
智能零售
基于人脸识别、人体分析、图像识别、大数据分析等核心AI技术能力, 赋能线下门店、商超、MALL、品牌商各类零售业态, 助力会员管理、客流分析、商品结算、货品陈列稽查等业务场景升级,提升商业效率
会员识别
客流分析
自助结算
货品陈列自动审核
销量预测
耗损预警
互动营销
智能教育
基于语音交互、 文字识别、 人脸识别、 人体识别、 AR等多项AI技术, 赋能软硬件教学产品,实现更好的人机交互的教学体验, 用更低的师资成本获得高质量的教育效果; 同时打造智慧校园,实现校园安全、校内考勤、课堂效果监测等关键场景业务升级, 提升校园生活体验和安全性, 降低管理成本
作业辅导批改
作文批改
语音辅助教学
智能辅助教学
教育直播审核
课堂专注度分析
考生远程身份认证
人员通行管理
学生自助服务
校园安防
考勤管理
智能家园
基于人脸识别等技术, 针对社区、楼宇等地产环境, 提供人员/车辆通行管理、 安防布控、智慧服务、无人作业车、智慧家居等场景方案, 全面提升管理效率与安全等级
人员通行管理
车辆通行管理
安防布控
智慧服务
无人作业车
企业服务
将人脸识别、文字识别、语音交互等多项AI能力应用于 电销、客服、语音质检、协同办公、员工考勤、单据识别等业务场景, 提高企业内部管理效率, 通过智能化企业服务降低成本,增加竞争力
智能电销
智能电话客服
智能语音质检
智能在线客服
智能协同办公
智能员工考勤
智能单据识别
信息服务
在信息处理场景下,提供各种技术接口 整合语音搜索、 图像搜索、 智能录入、 口碑分析、 有声阅读、 内容审核、 内容分类等信息服务解决方案, 解放人力,降低成本,提升产品竞争力
语音搜索
图像搜索
智能录入
口碑分析
有声阅读
语音播报
内容审核
图片分类
文本分类
智能工业
基于人脸、图像、AI框架等技术, 针对工厂质检、 仓储物流、 智能监控等场景, 提供物流安全、生产线质检、园区管理等场景方案, 全面提升安全生产管理能力
园区无人作业车
仓储物流
生产线质检
智能监控
园区管理
工业建模及应用
智能政务
融合语音技术、人脸识别、文字识别等多项AI技术, 应用到智慧城市、 政府办公、 信息管理 公共服务等场景中, 助力政务决策、业务流程优化, 提升利企便民服务体验
智能问答
智慧大厅
远程认证
智能检索
会议管理
政务大数据
智能硬件
多种多样搭载AI能力的智能设备 在餐饮、酒店、零售、养老、地产、金融、商超、物流等多元化场景中 给厂家和商户带来崭新的商业空间和价值, 为用户带来前所未有的便捷和体验
服务机器人
智能售卖机
智能门禁
智能闸机
智能穿戴设备
智能音箱
智能农业
基于图像识别、AI框架,AI硬件等产品技术, 针对智能农业地块识别、 作物模型构建、 病虫害识别、 无人机植保、 智能农机、 智能分拣、 农产品溯源、 智能养殖等场景, 提供针对相应场景的能力集合, 帮助农业提高数字化、智能化水平,创造更大价值
智能农业地块识别
作物生长预测
病虫害识别
智能分拣
农产品溯源
智能医疗
基于AI中台能力, 构造如临床辅助决策系统、 眼底影像分析系统、 医疗大数据整体解决方案、 智能诊前助手、 慢病管理平台等产品系列, 服务院内院外全场景
临床辅助决策系统
医疗大数据治理
眼底影像分析系统
智能诊前助手
应用
智能零售
门店智能顾客管理
通过人脸检测抓拍、和库中人脸比对的方式获取来人身份信息,尤其应用于新零售场景中,可用于识别门店会员,与系统中的会员购买记录、联系方式等信息匹配,推送给店员,实现精准营销。

人脸会员识别
结合精准人脸识别的会员管理,全面提升服务质量与顾客体验
方案流程
智能货柜
自助结算台
AR商品包装展示
VR商品包装展示
智能农业
农作物生长预测
农作物病虫害识别
作物生长影响因素智能调节
无接触牲畜估重
特殊牲畜活体识别
农业场景数字化能力
智能教育
AR教育行业应用方案
VR K12教室
VR高校实验室
智能医疗
医学文本结构化
智能合理用药引擎
智能ICD编码服务
智能分诊
智能工业
工厂安全生产监控
工业智能质检
信息服务
行业知识图谱解决方案
视频直播行业应用方案
虚拟主播视频智能生产
虚拟形象与生成驱动解决方案
虚拟主播直播解决方案
衣食住行中的 AI
智能试衣库=计算机视觉+3D建模技术
智能导购=RFID电子标签=射频识别技术
Coco Nutrilonist=语音识别技术+语义分析技术+AI分析营养数据
阿里未来酒店=人脸识别+语音控制+智能机器人等
无人车=无人驾驶技术
冲击广告行业和媒体行业
“鲁班”人工智能设计师=深度学习
AI写作=自然语言处理+文字创作场景
冲击教育行业
AI考试=自然语言处理+考试场景
AI阅卷=自然语言处理+阅卷场景
冲击艺术创作行业
图像风格迁徙=CNN技术/GAN网络技术+创意场景
AutoDraw=图像识别技术+绘图场景
AI制曲=深度神经网络学习
冲击物流行业和工业行业
物流机器人
无人车派送=多种传感器+计算机视觉技术+360度感知路况
无人车间
突破你的想象
医疗"黑洞"
拿着手术刀的AI医生会看病吗?
机器人"捕手”
作诗的AI机器人为什么能骗过行家?
陪练机器人来了,你打得过那个AI吗?
生活"局中局"
AI同声传译为什么成了巨头们都翻不过去的坎儿?
人类什么时候才能听懂动物的语言?
机器进化
猪脸识别为什么比人脸识别更有趣?
AI能翻译婴儿语言吗?
为什么人类既期待又排斥"读心机"?
人工智能技术与应用
语音识别
重要性
语音传递信息是人类最重要、最有效、 最常用和最方便的交换信息形式
定义
从语音到文本的转换
原理
训练
识别
失真测度
主要识别框架
分类
按识别器的类型
孤立词识别
关键词识别
连续语音识别
按识别器对使用者的识别情况
特定人语音识别
非特定人语音识别
按语音词汇表的大小
有限词汇识别
无限词汇识别
历史
1952年 世界上第一个能识别10个英文数字发音的实验系统。 1960年 第一个计算机语音识别系统。
70年代
80年代
90年代
机器学习
基本概念
机器学习➡️一种实现人工智能的方法
分类
基于学习策略的分类
结构化学习
非结构化学习
基于学习方式的分类
概念学习
规则学习
函数学习
类别学习
贝叶斯网络学习
应用领域
数据分析与挖掘
模式识别
生物信息上的应用
其他
相关算法
机器学习算法简介
回归分析算法
决策树算法
贝叶斯算法
支持向量机算法
聚类算法
关联规则算法
人工神经网络算法
深度学习
集成算法
人工神经网络
神经元与神经网络
BP神经网络
Hopfield神经网络
人工神经网络发展
深度学习
深度学习由来
卷积神经网络介绍
经典深度学习网络模型
机器学习常用框架
案例实现
鸢尾花分类
扫描数字识别
智能机器人
智能机器人基本概念
机器人概述
什么是机器人
机器人三原则
机器人的分类
替代人类器官
机器人智能水平
机器人应用用途
机器人发展简史
古代机器人
近代机器人
现代机器人
智能机器人及组成
什么是智能机器人
只能机器人基本特征
只能机器人的组成
智能机器人现在与未来
智能机器人典型应用
智能机器人关键技术
智能机器人应用欣赏
机器视觉
计算机视觉基本概念
改变人类“看”世界的方式
人工智能已来临
计算机如何感知世界
科幻电影中计算机视觉系统
现实生活中的计算机视觉智能实现
定义
让计算机之眼代替人眼,看懂所在世界
计算机视觉定义
物体的识别
物体的定位
物体运动的判断
计算机视觉研究的意义
看
认知
发展简史
计算机视觉是感知智能中最主要的一个方面
20世纪60年代
计算机视觉正式成为学科
20世纪70年代
图像建模成为热点,视觉理论得到发展
20世纪80年代
基于神经网络的模式识别蓬勃发展
20世纪90年代
基于机器学习视觉算法全面开花,光反应用
21世纪后
基于深度学习视觉技术爆发增长并产业化
现状与未来
现状
测试计算机视觉科技的几个范畴
当前计算机视觉技术应用的现状
未来
5G的到来必将推动其发展
会更注重数据保护和安全
会更深入人民的日常生活
计算机视觉相关技术
数字图像处理技术
图像点运算
图像几何变换
图像增强
图像分割
特征提取
图像识别初步
基于深度学习的视觉处理技术
图像分类
目标检测
目标跟踪
语义分割
物体分割
通用视觉识别技术流程
目标检测
目标识别
行为识别
计算机视觉典型应用
无人驾驶技术
人脸识别技术
目标跟踪技术
VR虚拟技术
工业检测技术
医学图像处理
计算机视觉典型企业及服务
人工智能产业和应用介绍
多个领域
智能医疗
疾病预判
医疗影像
药物挖掘
远程问诊
智能交通
自动驾驶
交通控制
车辆识别
车辆检测
智能家居
智能照明
智能门锁
家庭控制
家庭机器人
智能制造
产品检测
智能运维
智能供应链
工业机器人
智能金融
贷款评估
智能投票
智能客服
金融监管
智慧零售
智能结账
无人商店
智能配货
智能物流
智能通信
流量调度
网络控制
网络优化
网络异常监测
智慧教育
作业批改
智能问答
虚拟课堂
远程辅导
两类产品
复合产品
特征识别
人脸识别
指纹识别
声纹识别
虹膜识别
智能运载
自动驾驶汽车
无人船
轨道交通系统
无人机
智能机器人
工业机器人
特种机器人
服务机器人
家用机器人
智能设备
智能摄像头
智能音响
智能可穿戴设备
工业机器人
多个领域
自然语言处理产品
语义理解
机器翻译
语音识别
语音合成
知识图谱产品
问答系统
智能搜索
情报分析
智能验证
计算机识别产品
图像识别
视频监控
三维视觉
图像处理
人机交互产品
语音交互
体感交互
情感交互
脑机交互
案例
从2020年双十一开始,淘宝将逐步启用机器人送快递,因为基于人工智能的自动驾驶技术已经成熟
在家用轿车之后,特斯拉发布了纯电动无人驾驶卡车,未来AI将全面取代司机。
亚马逊和阿里都搞了无人商店,超市门口扫码收钱的阿姨没了,拿货直接走人,钱从支付宝上自动扣。
就连医生、律师、记者这些专业能力要求高的工作,都可以用AI高效完成。