导图社区 《漫话人工智能:坂本真树老师带你轻松读懂人工智能》
《漫话人工智能:坂本真树老师带你轻松读懂人工智能》将读者群设定为普通大众,旨在令不熟悉人工智能专业词汇、没有专业背景的普通读者也能够读懂本书。书中所选取的都是人工智能基础研究相关的代表性主题,也是读者想要了解的问题,如人工智能是什么时候出现的,人工智能会超越人类吗,什么易导入人工智能,什么不易导入人工智,怎样从信息角度来学习人工智能,人工智能应用的领域有哪些等等。
编辑于2021-05-28 23:36:52(Python数据分析与可视化)数据分析学习(56学时)思维导图,包括教材:智能数据分析智能数据分析概述、教程:Python编程语言核心基础(2学时)、视频等内容,一起来看看吧。
《漫话人工智能:坂本真树老师带你轻松读懂人工智能》将读者群设定为普通大众,旨在令不熟悉人工智能专业词汇、没有专业背景的普通读者也能够读懂本书。书中所选取的都是人工智能基础研究相关的代表性主题,也是读者想要了解的问题,如人工智能是什么时候出现的,人工智能会超越人类吗,什么易导入人工智能,什么不易导入人工智,怎样从信息角度来学习人工智能,人工智能应用的领域有哪些等等。
社区模板帮助中心,点此进入>>
(Python数据分析与可视化)数据分析学习(56学时)思维导图,包括教材:智能数据分析智能数据分析概述、教程:Python编程语言核心基础(2学时)、视频等内容,一起来看看吧。
《漫话人工智能:坂本真树老师带你轻松读懂人工智能》将读者群设定为普通大众,旨在令不熟悉人工智能专业词汇、没有专业背景的普通读者也能够读懂本书。书中所选取的都是人工智能基础研究相关的代表性主题,也是读者想要了解的问题,如人工智能是什么时候出现的,人工智能会超越人类吗,什么易导入人工智能,什么不易导入人工智,怎样从信息角度来学习人工智能,人工智能应用的领域有哪些等等。
漫话 人工智能
1. 人工智能是什么
1. 人工智能是什么时候出现的?
人们研究人工智能的目标不是知道人类在做什么,而是要通过人工(从工程学角度)实现人的智能。
图灵测试(模仿游戏):测试者有人类担任,测试者与搭载人工智能得计算机进行五分钟的对话。然后判断对方是人类还是人工智能。2014年俄罗斯研发的人工智能Eugene Goostman通过了图灵测试。电影:模仿游戏、机械姬、终结者、她、超越那一天
人工智能拥有人类的感情是困难的,但可以让人类误以为它们拥有感情。
人与人工智能的一大区别是“是否拥有身体”,此外,思考也是二者的区别之处。人类是拥有问题意识的,并能够致力于解决问题,而人工智能是无法自行寻找问题的。
人工智能的研究是伴随着计算机开始的,伴随着计算机发展的。硬件系统上,摩尔定律认为:每一美元所能买到的电脑性能,将每隔18-24个月翻一倍以上。
人工智能(Artificial Intelligence)是1966年夏天,与达特茅斯会议提出的。1946年,电子数字积分计算即ENIAC面世。1951年,明斯基制造了神经网络学习机器硬件,是世界上第一个自主学习的人工智能。
3次人工智能热潮
20世纪60年代第一次AI热潮,是通过解决比赛中的问题来实现的。但亟待解决的社会问题是无法依赖当时的人工智能解决的。
20世纪80年代第二次AI热潮,专家系统通过吸取各个特定领域的专业知识,来成为该领域专家的人工智能,其中斯坦福大学的MYCIN系统十分著名。采取怎样的知识表达方式才能让计算机更容易处理呢?
20世纪90年代中期,搜索引擎诞生,21世纪广域网的发展,获取大量信息又不可能转为可能。随着计算机能够自主学习,掀起了第三次AI热潮。
2. 这是人工智能?
人工智能研究≠机器人研究,但也有重合的部分。
机器人是同时拥有感知、控制、驱动三大技术要素的机械。人工智能不需要物理性的身体,只要有计算机程序操控。
如果你的目标是研发现实社会中和人类共存的人工智能,那么需要一个能够和环境进行交互作用的身体。
五级人工智能
第1级人工智能指包含简单控制程序的家用电器等,其控制程序只是简单地关联了输入(传感器)和输出(执行器)关系。(很多时候,人工智能只是营销的噱头)。
第2级人工智能具有各种感知和行为模式,以及对问题的响应模式,也就是非常讲究关联输入和输出方法的人工智能。例如:扫地机器人、诊断型程序等。
第3级人工智能是引入了机器学习的人工智能,隐藏在搜索引擎里,或以网络上的大数据为基础自动进行判断的人工智能。深度学习是指计算机自动提取特征,推进学习的过程。深度学习是机器学习的新方法,是比机器学习水平更高的人工智能。
从人类这里学习到特征
第4级人工智能,专用人工智能在特定领域发挥有限的智能。
即使没有从人类这里学习到特征,也能自己提取特征进行学习
第5级人工智能,通用人工智能不仅具有与人类相同的智能,还拥有第4级专用人工智能的能力。
3. 人工智能会超越人类吗?
奇点
奇点(技术奇点),当人工智能可以自己制造出超越自己能力的人工智能时,这一时间被称为奇点。
可能对人类构成威胁的真正奇点不是个别领域的奇点,而是通用人工智能实现后的奇点。
实现通用人工智能需要复制人类大脑进行研究。大脑新皮质(负责诸如视觉、听觉、语言、计算和计划之类的处理工作)——无监督学习;大脑基底核(尽量做对自己有益的事,不做无益之事)——强化学习;小脑(简单的神经回路)——监督学习。
雷·库兹韦尔说将人的意识传到计算机便能使人长生不老。松尾丰说,人工智能征服人类是不现实的。难以赋予人工智能生命,人工智能不太可能进行繁殖。
如果人工智能可以替代我们的大部分工作,那么人们或许会从劳动中解脱出来,但社会的两极分化会更加严重。
人工智能具有较高的声音和图像识别能力,很强的预测能力,高水平的执行能力。因此,将来有一些职业会消失。
人工智能不具备与外界相互作用的身体,也没有捕获信息的五官,无法理解所谓的常识或隐含的意思,无法发挥出引导人行动的领导力,不能拥有真正的心。
2. 容易导入人工智能的事物和不容易导入人工智能的事物
更好地理解人类和人工智能的区别
1. 容易导入人工智能的事物
人工智能可以包含网络上的任何信息。
计算机上字符和数字都被数字数据“0”和“1”替换,然后处理并存储。
人类通过五感获取信息,计算机以各种文件格式捕获信息。各种数据以文件形式存储在计算机中。计算机易于处理的语言、动画和音频之类的信息,也可以很好地应用于人工智能中。
动态图像是人们视觉获得的信息,也可以应用于人工智能中。
1975年,伊士曼柯达公司开发了世界第一台数码相机。数码相机的像素越高,图像质量越好。
像素大的话,图像会显得更加自然。在视觉处理方面,人工智能超过人类的可能性也很高。
图像数据集的建立使得全球的研究人员能够用同一数据集来竞争各自的图像识别精度。 手写数字识别库是训练计算机手写文字识别能力的数据集,包含0~9的10个数字的各种手写体,常用于图像识别研究。文字识别技术在20世纪80年代就已经达到了很高水平。
图像识别竞赛ILSVRC,ImageNet包含了超过1400万丈照片。人工智能通过机器学习的途径学习1000万张照片,再用其中15万张照片进行测试,识别正确率最高的获胜。 2012年,基于深度学习的图像识别技术再这个比赛上正式发布。 GPU技术的进步也为计算机能力的迅速发展做出了贡献。 除了物体识别,人工智能也逐渐实现只有人类在才能做到的“质感识别”。 目前人脸识别技术可以说与人眼视觉相当,甚至能够超过人眼的视觉能力。
视觉
计算机语音输入,将语音识别为语言的”语音识别“。 2016年以后,语音识别的精确度据称以达到了90%以上。现如今,语音已经算是人工智能较为容易识别的信息了。
语音识别第一步是将语音信息输入计算机,周围的杂音和混响是一个问题,这需要高性能的麦克风。语音信息都是波形数据显示,通过比较用2个麦克风捕捉到的不同波形,将语音和杂音区分开。
多麦克风可以识别音源和人的位置,从人声读取人的情感并判断。 为了防止杂音导致语音识别系统出错,现如今应用检测人类说话时间的语音检测技术和去除混入杂音的杂音消除技术。 多模态语音识别技术同时运用图想信息和语音信息使得语音识别更加准确高效。
把语音转化为文字:语音信号转换成语音特征向量(将语音各种各样的特征数字化后进行汇总统计),从一系列特征向量种,推断出对应的单词序列。通过声学模型和语言模型两个模块完成。
声学模型是对识别的声音波形进行处理,将其分解成最小单位因素,先识别出每个音素的特征,在输出成为一个个的字词。匹配过程一般使用隐马尔可夫理论。 语言模型是正确高效地识别单词之间的语义联系。 语义识别深度学习技术改进的声学模型错误率降低到20%以下。
听觉
2. 不容易导入人工智能的事物
人工智能能够正确地获得语音和文字信息,但是很难读懂其中所要表达的含义。
语义网络,描述节点之间的相互联结和节点之间的网络关系。
将语言数据导入到计算机中,让计算机自主地寻找概念与概念之间的关系。计算机就算不算理解单词的意思也能够答题,2011年IBM的Watson机器人登上美国答题节目Jeopardy并夺魁。人工智能很理解文章的意思,而是快速检索和问题本身可能有关的关键词后再作答。
人工智能的语义分析采用统计学的潜在语义分析解决单词的多义性。在规模巨大的多次元空间进行但此配置,然后将任意单词的语义距离用空间距离描述。语义空间以大量的文章和书籍中单词的出现频率与其同时出现的单词的出现频率的分布统计为基础自动生成的。
2011年日本国立情报研究所主导的Torobo-kun机器人理科数学成绩优秀,但是需要深刻理解语言含义的考试中表现平平,最终放弃了自己的东大梦想,
文章含义
人类通过视觉、听觉、嗅觉、味觉、触觉获取外界信息,人工智能只有视觉和听觉。
人工智能的味觉是运用人工智能本身的语言信息处理能力推测人类最有可能喜欢的菜品。
人工智能的嗅觉通过遥感系统感应大气中的气味进行识别。
智能传感器可以感知天然气泄露,识别气味的人工智能研究较少。
人工智能研究和机器人研究的交叉领域中,人形机器人研究领域非常重视触觉。
人工智能的触觉需要触觉传感器表面能够拉伸和收缩,触觉研究是难点。将触觉感受用语言表示,人工智能也能间接拥有触觉。
3. 人工智能是怎样从信息中学习的?
1. 什么是机器学习?
为了让计算机在没有人设定的程序下也能自动完成工作,就必须让机器学习事物的特征和规则,这就是机器学习。机器学习分三种:监督学习、无监督学习和强化学习。
监督学习
监督学习指数据和正确答案的组合导入计算机内,令其学习特征和规则的方法。
监督学习可以分为分类问题和回归问题。
分类问题是对问题进行分类,经典例子就是判断垃圾邮件,以分数为依据,顺利区分普通邮件和垃圾邮件。
回归指的是能够得出具体数值。回归问题是从多组数据中得出一条线,这是一条能够很好地解释数据的线。
预测降水量:多变量线性回归式,找到与实际数据最一致的函数,就能得到关于数据的规律性和真理。
泛化能力:应对未知信息的能力,也就是一般化、普遍化的能力。 监督学习要提高泛化能力,当心过度学习/过拟合。参数越多且有多种要素表现的模型越容易陷入过度学习,所以要限定参数。
无监督学习
无监督学习让计算机分析不知道正确答案的数据,令其发现其中的特征和规律,即让计算机自己去思考“如何分类的方法”。无监督学习不需要与数据对应的正确答案。
企业将顾客按不同类型进行分类的时候就会使用无监督学习,这样可以给不同类型顾客推荐适合的商品。
邮件分类也可以交给计算机。
聚类是将所得数据中的相似数据总结在一起的方法。聚类的目的是将那些没有正确答案的数据,通过一定的法则使其看起来更容易让人理解,并能够回答人们“从中发现数目?如何解释”的问题。聚类应该设定一个前提,不然会有各种各样的分类方法。
k-means是聚类的代表性方法,前提是任意一组都要包含相同个数的数据,分k组必须提前确定。如果强制分组,会出现让人难以理解的地方。
强化学习
强化学习让计算机不断从反复的失败和成功中完成学习。熟能生巧,和无监督学习相似。将计算机的目标设定为获得更高的得分,在反复是错的过程中,失败了就施以惩罚,成功了就给分。通过这方的方式,是计算机不断朝着目标迈进。
2. 什么是神经网络?
人脑拥有300亿个神经元(脑神经细胞),通过各种各样的形式结合在一起,传递和处理信息,从而完成记忆、计算、思考、认知等行为。计算机模仿人脑构造就是神经网络。神经元的作用是处理信息和给其它神经元传递信息,也就是输入和输出。神经元之间信息传递是通过突触完成的。
人工神经元的数学结构:一个神经元从其它神经元接收信号,产生与其接收的信息量相对应的兴奋和抑制性能。刺激力度的大小决定神经元是否兴奋,信号总量≥阈值→兴奋,信号总量<阈值→抑制,人工神经元的构造就是在模拟真正的神经元。将将简单的人工神经元组合在一起构成神经网络,调整好权重,计算机就可以完成所有信息处理。
权重代表了信赖度和重要度
赫布定律:突触前后的神经元在同一时间被激发时,突触间的联系会加强。
感知机是将人工神经元排列成两层联系在一起的构造,它逐渐学会了监督学习。
感知机无法解决线性不可分问题。
BP算法(误差反向传播算法)将误差从输出层反向传回,纠正各个神经元的错误,从而减小误差。可以解决双层感知机无法就解决的非线性分离问题。
具体流程
先将学习样本提供给神经网络
将神经网络的输出值与样本的最优解进行比较,计算各输出神经元的误差
将输出值与样本的期待值进行比较,计算误差
根据隐层神经元的结果,计算各神经元连接权重的误差
为了减小误差,调整权重
以学习手写数字为例:(1)以像素点为单位作为输入层,任意数目的隐层,以输出数字为输出层(2)计算一个数值的加权变大时误差是否会变小,加权变小时是否会变大(3)同时为了减小误差,不断对参数进行微调。
增加层数,信息传递不到
三层神经网络可以处理双层神经网络无法处理的信息。
四层以上的BP算法的学习无法推进。
支持向量机
支持向量机时贝尔实验室于1995年 发表的用于模型识别的监督机器学习算法
支持向量机泛化能力高,拥有优秀的模型识别能力。
模型识别是指输入的数据进行“分离”。
认识图像和认识文字。
泛化能力:根据学习数据得出的识别线,判断哪些是未学习的数据。
用于解决线性不可分问题
擅长将数据分为两组,但并不适用于多级数据的分类。
间隔最大化
BP会在正确识别出学习数据那一刻终止,会出现集体的边缘触碰到线的情况。
支持向量机能够找出两组数据之间距离最大的地方(最大间距),并在其中间画线。
3. 深度学习有哪些厉害之处?
2012年,图像识别竞赛ILSVRC,多伦多大学的深度学习夺得冠军。
在深度学习出现之前,特征必须通过人来设计,有了深度学习,计算机可以自己提取特征,并以此为基础进行图像分类。
深度学习指的是多阶层(4层以上)的神经网络。
自编码的输入和输出是相同的,自编码是一种信息压缩器,每一层都能进行学习。
输入和输出相同时,在隐层的位置就出现了该图像的特征,中间有压缩和复原的过程。
神经网络和深度学习的思考方式越来越接近人类了。
深度学习方法
卷积神经网络CNN
模拟人脑视觉领域的神经回路模型
卷积是数学上卷积积分的运算方法
循环神经网络RNN
RNN是内部有闭路的神经网络,可以记忆瞬时信息,进行动态变化。因此,RNN可以捕捉到系列数据中存在的逻辑。
玻尔兹曼机
玻尔兹曼机是随机生成神经网络,在网络的行为中引入温度的概念,使其刚开始激烈,之后趋于平稳。
使用梯度下降法的BP算法只能捕捉局部解,玻尔兹曼机通过随机优化方法可以从局部解中脱离出来。
玻尔兹曼机一般当作数据的生成模型。
4. AI三大模型中的“遗传算法”是什么?
AI三大模型
神经网络
专家系统
遗传算法
优秀个体=优秀回答,让计算机使用进化的方法找出最佳答案。
GA擅长从无数答案中找出或解出最佳的那一个。
GA广泛应用于游戏、股票交易、飞行路线的优化、飞机机翼大小的优化等多个领域。
4. 人工智能的应用实例
1. 人工智能的进化在游戏中的应用实例
国际象棋专用计算机“深蓝”采用专家系统,以人类决定的规则,输入的知识库为基础。
日本象棋采用机器学习,从庞大的棋谱中学习棋盘和棋步,慢慢地找出特征。
AlphaGo不需要人类来教授围棋的规则,从过去围棋选手庞大的对局记录中自主学习。
2. 第三次AI热潮的导火索在“图像”领域的应用实例
谷歌的猫:计算机读取1000万张图像,令其自主学习“猫的概念”。
图像识别的发展
人脸识别
指纹识别
手写汉字识别
医疗领域的应用
弥漫性肺病:使用图像识别,从CT图像中找出病灶。
恶性黑色素瘤的判别
癌症检测
3. “自动驾驶AI”的实际应用
自动驾驶水平
计算机分别独立控制汽车油门、方向盘、刹车。
计算机控制两个及以上部分,且可以互相配合。
计算机控制汽车油门、方向盘、刹车,但紧急时刻有人类驾驶员进行操作的半自动驾驶。
人类驾驶员不参与驾驶的完全自动驾驶。
自动驾驶需要多种要素
传感器
3D地图数据库
从传感器获取的信息中判断情况,控制油门、方向盘、刹车的电子控制单元。
依靠人工智能给电子控制单元发出指令。
自动驾驶的训练步骤
通过传感器获取速度和方向变化等数据,制作虚拟在线的模拟装置。
在虚拟空间对AI进行训练,使其学习如何驾驶。
让多辆车行驶,提高学习效率。
推断车辆位置
激光雷达
3D地图
GPS
4. “对话AI”的应用实例
自动对话系统
有知识
检索出问题所含的关键词和与问题相关的答案
无知识
聊天机器人
制造对话的三种技术
辞典型
提前制作单词辞典和模板
对输入的单词已有决定好的对应答案。
对话型
把过去的对话当作样本数据进行学习,然后将样本对话中的答案直接作为答案的方法。
马尔可夫型
把对话逐一分解成每个单词时,使用这些单词之后出现概率高的单词来生成文本的方法。
为了自然对话
5. “遗传算法那”在“拟声拟态词”上的应用实例
拟声拟态词指的是拟声词和拟态词,可以简洁地表达感情和氛围等,研发出能够理解拟声拟态词的人工智能,在贴近人心上是十分重要的。
作者用遗传算法制作拟声拟态词生成系统
从录入数据库的拟声拟态词中搜索的词典系统,生成拟声拟态词,并具有与用户输入的印象评价相吻合的音韵和形态。
拟声拟态词的生成
排列组合生成拟声拟态词个体
根据用户输入的印象评价值,对初期随机生成的拟声拟态词个体群进行选择和淘汰
优化过程P162
6. AI在“艺术”领域的实践
小说
绘画
作曲
5. 结语
未来的人工智能研究,“感性”是关键。