导图社区高中数学各分支一览

高中数学各分支一览

这是一篇关于高中数学的思维导图，对高中数学的各分支重新排列整理，并对各分支的用途进行简述。主要内容包括：1.集合与映射，2.数系，3.函数与不等式，4.数列，5.几何，6.计数原理，7.概率论，8.数理统计，9.微积分初步。适合需要对初等数学有整体认知的学生。

编辑于2026-02-26 17:51:57

数学
概率论
高中数学
计数原理

吃货

他的近期作品查看更多>>

高中数学各分支一览

社区模板帮助中心，点此进入>>

吃货

他的近期作品查看更多>>

相似推荐
大纲

开学典礼：时间规划
- 4.8k
- 157
- 80
- 11
- 0
Jason
大学生职业规划思维导图
- 6.2k
- 50
- 39
- 11
- 0
吃太阳的猫????
大学生职业发展规划
- 4.7k
- 158
- 61
- 8
- 0
远走高飞
大学生职业规划知识总结
- 4.6k
- 9
- 60
- 9
- 0
雪茉
大学生毕业去向
- 3.7k
- 14
- 42
- 6
- 0
美少女
大学生行为礼仪规范
- 3.0k
- 53
- 50
- 10
- 0
呱小呱
全国大学一览图
- 3.5k
- 14
- 146
- 23
- 0
17316931273
大一新生入学必备物品清单
- 3.2k
- 7
- 68
- 14
- 0
北冥有鱼
蓓蕾入学
- 1.5k
- 3
- 0
- 0
- 0
金兰＇s
大学生创业基础
- 7.2k
- 112
- 100
- 20
- 0
罙

高中数学

1.集合与映射

概述

集合与映射是现代数学的基础语言

集合研究"对象的整体"，用于描述范围、分类对象、进行逻辑推理、构造数学结构等

映射是一种"规则"，用于描述从一集合到另一集合的变化和关系

进入高中后，初等数学不在重点关注"数字"，转而研究"关系"——函数关系、位置关系、模型拟合关系等，这些关系都是集合与映射的延申

1.1.集合与常用逻辑用语

集合

定义

集合中元素的特征：确定性，互异性，无序性。

元素与集合的关系关系：属于∈，不属于∉ 。

集合的表示方法：列举法、描述法、图像法等。

用途

规范表达所有数学结果

方程的解：{x∣x2 = 1} = {−1,1}

不等式的解集：{x∣x>1}

函数定义域、值域、点坐标、图形上的点等

开区间、闭区间、半开半闭区间

按条件筛选/分类元素

集合的基本运算：并集∪、交集∩、差集-、补集C

全称量词、存在量词

用于数学逻辑的推理

必要、充分、必要不充分、充分不必要、充要、既不充分也不必要

A={x|p(x)}, B={x|q(x)}

作为概率论和数理统计的基础

古典概型里的基本事件、样本空间，都是集合。

排列组合本质是：从集合里按规则选元素。

映射

1.3.函数的概念与性质

定义

设X,Y是两个给定的集合，若按照某种规则f，使得X中的每一个元素，都可以在Y中找到唯一的元素与之对应，则称这个对应规则f是集合X到集合Y的一个映射。

X中的元素称之为原像也称逆像，Y中的元素称之为像。

用途

明确什么是“两个集合之间的一种对应关系”

给出函数的明确定义

作为更高级的对应关系的基础

点→点、向量→向量、图形→图形的映射

为解析几何变换、向量、三角函数、反函数打下基础。

2.数系

数系的发展是为了解决"我们需要什么样的数，才能描述世界"

自然数→整数→有理数→实数→负数

每一次数系的拓展，都是为了解决"算不下去"的问题

自然数域 N

解决了自然界的计数基础

加法、乘法封闭，减法、除法不封闭

整数域 Z

解决了自然数的减法

有了"方向"这一概念的明确表述

加减乘封闭，除法不封闭（1÷2 不是整数）

有理数域 Q

解决了整数的除法（不可比的数）

有了"比例"这一概念的明确表述

加减乘除（除数≠0）封闭

实数域 R

第一次数学危机：公元前5世纪，发现边长为1的正方形，对角线长不是有理数

解决了x2=2

定义了实数 R = 有理数 + 无理数

意义

填补数轴空隙 → 令数轴连续，实数与数轴上的点一一对应

加减乘除封闭，极限运算封闭

让连续、极限、微积分有了数学基础

数域从「离散、稀疏」变成连续完备

复数域 C

1.7.复数

16世纪卡尔达诺公式解三次方程，部分有实数解的方程需要用到负数开平方

解决了x2=-1

意义

数域达到代数完备，不再需要继续扩张

加减乘除、开方、代数运算全封闭

令所有代数方程都有解——在复数域C中，n次代数方程一定有n个复数根

复数打通了代数与平面解析几何的通道，把代数运算变成了几何变换

复数是代数版的向量，向量是几何版的复数

几何变换包括平移、旋转、反射(对称/翻转)、缩放等等

学完高中数学，可以试试用向量法描述复数的简单几何变换

如z' = z · (cosq + isinq)

表示式

代数表示式

三角表示式

复数的四则运算

加减乘除

交换律、结合律、分配律

3.函数与不等式

概述

函数是描述变化的工具，即"映射+映射规律"，其核心不在函数式，而在于"映射规律"

该规律解决了如何精确描述"变化"这一问题

该工具可用于解决数值的取值范围、大小比较等问题

学习函数时，应做到公式、图像、性质，三者可以相互转换

1.3.函数的概念与性质

定义

高中用集合和映射规范定义了函数

函数就是一个输入，对应一个输出的规则，写作y = f(x)

描述函数

表达式(即映射规律)

定义域、值域

函数图像

性质

单调性

奇偶性

周期性

最值、极值

零点

渐近线

基本初等函数

指数函数

1.4.指数函数与对数函数

对数函数

1.4.指数函数与对数函数

幂函数

1.2.一元二次函数、方程和不等式

注：圆、椭圆、开口左右的抛物线、双曲线并非函数（不满足单值性），但方程可拆解为两个单值函数，这两个单值函数可以由幂函数和常函数构造。

一元二次函数

韦达定理

三角函数

1.5.三角函数

2.2.直线和圆的方程

匀速圆周运动的数学模型

恒等变换

图形法证明恒等变换公式

向量法证明恒等变换公式

反三角函数

常数函数

函数的变换

使用函数图形、函数性质、函数公式，描述函数的变换：

平移

沿x轴、y轴缩放

对称

y轴对称

x轴对称

y=x对称

反函数

等式与不等式

概述

函数、方程、不等式，三者均在研究函数

举个例子

函数f(x) = 2x + 1

等式2x +1 = 5，是f(x) = 5的情况

不等式2x + 1 >5，是f(x) ＞ 5的情况

可以认为，函数给出了整体结构，等式在该结构上找特殊的点，不等式在该结构上找特殊的区间

等式和不等式都在约束函数

等式

即函数的方程

方程是求函数在特定条件下的取值

不等式

不等式用于使用函数来描述范围、限制边界、优化条件

1.2.一元二次函数、方程和不等式

基本不等式

一元一次不等式

一元二次不等式

绝对值不等式(即距离的范围)

4.数列

概述

数列是按顺序排成一列的数，是定义域为正整数的特殊离散函数

等差数列是离散版的一次函数、等差数列之和是离散版的二次函数、等比数列是离散版的指数函数

数列的通项公式就是联系自变量与因变量的函数(映射)

等差、等比等一切数列的求和，与函数的积分思路一致

但不能使用积分求数列之和

求和是离散面积、积分是连续面积，两者存在误差——“阶梯和曲线之间的差”

，左侧是数列求和，右侧是对应函数的积分

但对于单调函数（数列），可使用“数列之和一定夹在两个相邻积分之间”

如在函数/数列单调递减时，有：

上图中，图3的最右侧的阴影，表示1·f(1)；该值比图2中函数曲线上方的一系列近似三角形的面积之和要大

2.4.数列

常见数列

等差数列

等比数列

斐波那契数列

F1 = 1，F2 = 1，第3项起Fn = Fn-1 + Fn-2

是典型的二阶线性递推数列

根据性质求数列

求通项公式

求数列的第x项

求数列的前n项之和Sn

是否有单调性、最值

是否收敛到某个值（结合函数、不等式）

数学归纳法

是从有限到无限的逻辑桥梁

对于一个与自然数n相关的命题P(n)，其证明必须包含两个独立且严谨的定理：

步骤一（奠基步骤）：命题对初始值（通常是n=1）成立。即，P(1)为真。

步骤二（归纳步骤）：假设命题对某个自然数k成立（归纳假设），能推出命题对k+1也成立。即，若P(k)为真，则P(k+1)为真。

当且仅当这两步都完成时，我们才能根据自然数的良序原理断定：命题对所有自然数n都成立。

需注意，数学归纳法能保证到“任意有限大”都正确，但无法保证“无穷大”时的正确性

数学归纳法是证明一些有关自然数命题的有力武器

数学归纳法与“自然数”的概念密不可分（来源是皮亚诺（Peano）公理的第三条）

只对自然数、离散整数相关的命题有效，不能处理连续量

只能证明某些命题“对所有自然数都成立”

并不是什么问题都能数学归纳，因为该方法的前提是有一个预期的结果；即预先知道了结论，才能使用数学归纳法证明。

只能“验证”，不能“发现”

怎么获得这个预期的结果是另一个问题——一般情况下，考试时可以由题干获得预期结果。

5.几何

概述

几何是研究形状、位置、大小、关系的学科，用于解决空间关系是否成立

例如

点与点/线/面的距离

直线是否平行

直线与平面是否垂直

一个形体如何变换为另一个形体

方法有三种——欧氏几何、解析几何、向量几何

欧氏几何

概述

以5条公理为基础的整个几何体系

对空间想象能力和逻辑证明能力有很高要求

平面几何

形状

线段

三角形

平行四边形

形状间的关系

相似

全等

立体几何

1.8.立体几何初步

立体图形

描述立体图形

数学语言描述

多面体、面、棱、顶点

旋转体、轴

图形描述

斜二测画法

投影原理

常见立体图形

棱柱

棱锥

棱台

圆柱

圆锥

圆台

球

简单几何体的计算

表面积

体积

微积分初步

立体图形的位置关系

点、线、面

点在线上、点与线的距离、点与面的距离

两线平行/相交（垂直）/异面，线在面上、线与面的距离、线与面是否垂直、线与面的夹角/交点

面与面的距离、面与面是否垂直、面与面的夹角/交线

点共线/点构成平面、线共面/线构成平面

点、线、面的位置关系

用综合几何语言描述/证明平行、相交、垂直、异面、共面等

用空间解析几何描述/证明平行、相交、垂直、异面、共面等

向量法

解析几何

概述

用坐标把几何变成代数、用“坐标系+代数方程”来研究几何，把几何变成了算术题。

解析几何

平面解析几何

坐标系

平面直角坐标系

极坐标系

极坐标系与直角坐标系的转换

图形

直线

直线的方程

点斜式、斜截式、两点式、截距式、一般式

直线的极坐标方程

直线的参数方程

注：构造参数方程的难度在于找到好用的参数，令方程与参数产生对应的几何关系

直线的参数方程，是通过从函数图像上任意一点向坐标轴作垂线，再由参考点(a，b)向该垂线作垂线，从而构造出一个直角三角形，记该点到参考点的距离为参数t、该点与参考点连线的倾斜角θ，来构造参数方程的。

直线的参数方程，参数的意义不如圆和椭圆的明确。

倾斜角与斜率

倾斜角范围、斜率公式

直线的位置关系

与直线

平行

平行线距离

垂直

垂直判定

相交

焦点坐标

与点

两点确定直线、点+斜率确定直线等

点与直线距离

圆

圆的方程

标准方程

一般方程

圆的极坐标方程

单位圆和三角函数的关系

圆的参数方程

圆的位置关系

与直线相离、相切、相交

与圆外切、外离、相交、内切、内含

弧度制与角度制转换

2.2.直线和圆的方程

圆锥曲线

椭圆

定义（到两定点距离和为定值）

椭圆的方程

标准方程

参数方程

几何性质：长轴、短轴、焦点、焦距、离心率、a、b、c 关系

双曲线

定义（到两定点距离差的绝对值为定值）

标准方程

几何性质：实轴、虚轴、焦点、渐近线、离心率、a、b、c 关系

抛物线

定义（到定点与定直线距离相等）

四种标准方程

几何性质：焦点、准线、p 的意义

圆锥曲线的焦点

曲线上任意一点，到某些特殊点的距离满足某种关系——该特殊点即为焦点。

椭圆

平面上到两个定点的距离之和为常数的点的轨迹，这两个点即为焦点

当两个焦点重合时，椭圆变成了圆

说明焦点可以用来决定曲线的形状

双曲线

平面上到两个定点的距离之差为常数的点的轨迹，这两个点即为焦点

抛物线

到一个定点（焦点）和一条定直线（准线）的距离相等的点的轨迹

从焦点发出的光线，反射后会变成平行光

2.3.圆锥曲线的方程

空间解析几何

一般用向量法做空间解析几何题目，但时不时会出一道椭球、马鞍面等的题目可以用代数方程做

向量代数

概述

也叫"向量几何"，可以用向量代替函数方程

用向量描述形状、位置、方向

用向量对形状进行变换

平移

旋转

对称

缩放

投影

证明形状与形状的位置关系

平行

相交

垂直

异面

向量是一套可用于解析几何、线性代数和物理等领域的工具，熟练运用向量可简化解析几何的计算

向量是既有大小又有方向的量，有独立的运算系统（加减、数乘、数量积）

平面向量

1.6.平面向量及其应用

向量的运算

加法运算

平行四边形法则

交换律

结合律

减法运算

数乘运算

分配律

数量积

数量积不存在逆运算（例如物理中，两个不同方向的力形成的合力是唯一的，但将该合力分解时则有无穷多种组合方法）

交换律、分配律

用坐标表示向量

向量与平面解析几何的关系（向量是一种平面解析几何求解的工具）

正弦定理、余弦定理

用两个不共线的向量构建平面坐标系下的其他向量

空间向量

2.1.空间向量与立体几何

向量的运算

加法运算

交换律

结合律

减法运算

数乘运算

分配律

数量积

交换律、分配律

用坐标表示向量

三维空间中的余弦定理

空间两点间的距离公式

用空间向量表示直线、平面的位置关系

空间中点、直线和平面的向量表示

两直线平行、直线平行于平面、两平面平行

两直线垂直、直线垂直与平面、两平面垂直

点到直线/平面的距离、直线到平面的距离、两平行平面距离

两向量的夹角、向量与平面的夹角、两平面的夹角

用三个不共面的向量构建立体坐标系下的其他向量

6.计数原理

概述

计数原理按道理既不属于概率，也不属于数理统计；高中阶段，它是服务于概率论中古典概型、二项分布等(分布类型为"离散型"的概率模型)的计算工具

计算古典概型、二项分布、超几何分布等

总体有多少种情况

即“排列”

在高中阶段，古典概型的计算，完全依赖计数原理

符合条件的情况数

即组合

2.6.计数原理

分类加法计数原理

完成一件事有两类(方法互不相同的)不同方案，在第1类方案中有m种不同的方法，在第2类方案中有n种不同的方法，那么完成这件事共有N = m + n种不同方法

为计数原理的底层逻辑，后续可推导出排列、组合

分步乘法计数原理

完成一件事需要两个步骤，做第1步有m种不同的方法，做第2步有n种不同的方法，那么完成这件事共有N = m × n种不同方法

排列 A

组合 C

二项式定理

二项式定理将幂运算展开为多项式，在初等数学中，其作为高次展开和组合计数的工具

性质

对称性

递减性与最大值

各二项式系数的和

二项式定理连接了初等数学和高等数学

幂函数求导

泰勒公式——把任意光滑的函数展开成“无穷多项的二项式”

概率论中的二项分布

7.概率论

概述

概率论是已知事件发生的规律，研究出现某个结果的概率

这个"事件发生的规律"也算要学习的——就是本节的"概率模型"

高中数学一般研究“某个事件的条件概率”，研究对象是事件

大学概率论则研究“随机变量的条件分布”，研究对象是整体分布结构(分布函数)

即在已知概率模型的前提下，随机结果的性质是什么

概率、概率分布

数据特征

数学期望

方差

等等

是数理统计的理论基础

1.10.概率

事件

定义

进行随机试验

可以重复做、结果事先知道、但每次不确定

随机试验所有可能出现的基本结果构成的集合被称为"样本空间"

事件是某些可能结果构成的集合，是样本空间 Ω 的一个子集。

样本点（基本事件）是试验的每一个最基本、不能再拆的结果

将所有样本点放在一起，就是全集 Ω

描述事件发生的可能性

对随机事件发生可能性大小的度量（数值）称为事件的概率，事件A的概率用P(A)表示

事件的类型

必然事件

随机事件

不可能事件

事件的关系

包含 A⊆B

和事件/并事件 A∪B

交事件/积事件 A∩B

互斥/互不相容 A∩B = ∅

不能同时发生

互为对立 A∩B = ∅，且A∪B = Ω

不能同时发生，且必须发生一种

对任意两个事件A、B，有P(AB) = P(A)P(B)，则两事件相互独立

事件/概率的性质

对任意的事件A，都有P(A) ≥ 0

必然事件的概率为1，不可能事件的概率为0

古典概型中，概率为1的事件一定发生，概率为0的事件一定不发生

几何概型中，概率为1的事件不一定发生，概率为0的事件不一定不发生；如将一段绳子随机分成三段，由这三段构成等边三角形的概率为0，但存在这种情况。

如果事件A与事件B互斥，则P(A∪B) = P(A) + P(B)

如果事件A与事件B互为对立事件，则P(B) = 1 - P(A)，P(A) = 1-P(B)

考试最常用；比如一枚导弹命中目标的概率是0.2，求3枚导弹命中目标的概率，可转换为1-P(3枚导弹都没命中)

如果A⊆B，则P(A) ≤ P(B)

设A、B是一个随机试验中的两个事件，有P(A∪B) = P(A) + P(B) - P(A∩B)

概率模型

定义

概率模型用于抽象现实世界中的随机事件(即样本空间Ω)，并对这类事件的子事件(即事件P)的概率进行研究

用概率模型简化现实世界的一系列随机事件，规定

样本点是什么

每个结果是不是等可能

用个数/长度/面积/函数来计算概率

这些概率模型的分类方法多样，可能相互有交集，也可能属于完全不同的领域

当某伯努利概型的成功/失败概率相等时，则该概型也是古典概型

当某古典概型只研究成功/失败两种可能时，则该概型也是伯努利概型

2.7.随机变量及其分布

要素

样本空间Ω

所有可能结果的集合

事件(F)：样本空间的子集

概率测度(P)：给每个事件赋予一个满足公理的概率值

常用分类

分布类型

离散

二项分布

n次伯努利试验，求事件发生的次数

多项分布

是二项分布的多类别推广，用于描述一次包含多个可能结果的独立重复试验中，各类别结果出现次数的联合概率。

分类分布(Categorical distribution)

描述一次试验中多个离散结果之一发生概率的分布。它是多项分布在单次试验（n = 1）时的特例，用于表示一个有限类别随机变量的概率模型。

古典概型(离散均匀分布)

是多项分布在N=1且p_i相等时的特殊情形

超几何分布

高等数学中，超几何分布的概率和超几何函数有关，所以叫 “超” 几何。

几何分布

独立重复伯努利试验中直到首次成功所需的试验次数。

有趣的是，几何分布（Geometric distribution）和超几何分布（Hypergeometric distribution）没叼联系

泊松分布

在固定时间或空间区间内某事件发生的次数，其平均发生率已知且事件独立。

连续

正态分布

大量随机因素共同作用下的现象，如身高、考试成绩或测量误差。

连续均匀分布

描述完全未知或等可能的随机现象

几何概型属于此列

指数分布

描述独立事件之间的等待时间或间隔时间

样本结构

独立同分布

随机变量相互独立、分布完全相同(古典概型)时，某一个变量的分布

条件分布

在“已知某个事件或变量”的情况下，另一个变量的分布。

是条件概率的推广和系统表达

等等

古典概型

基本特征

有限性

等可能性

随机变量及其分布

研究随机事件的条件概率，建立概率的乘法公式和全概率公式，并用它们计算较复杂事件的概率

计算

P(A) = 事件A包含的基本事件数 / 总基本事件数

几何概型

基本特征

无限多结果

等可能性

计算

抽象为长度比、面积比、体积比

P(A) = 区域A的测度 / 总区域测度

伯努利概型

基本特征

n次独立重复试验

只有成功/失败

成功和失败的概率不一定相等

相等时，该概型属于古典概型

不等时，则不满足古典概型

计算

二项分布概率公式

条件概率

概述

条件概率用于：通过已知信息，重新定义样本空间(把样本空间缩小)

原本的样本空间Ω，当发生了事件A后，无需再考虑没有发生事件A的情况

样本空间Ω缩小为"发生了A"这一子空间A，A Ì Ω

为什么要缩小样本空间

事件相互关联、相互影响

当得知事件A发生后，该事件就把一部分不可能的情况排除了

举个例子

投2枚骰子，求2枚骰子点数的积为偶数的概率。

用古典概型描述

事件共6×6=36种情况

点数积为偶数共27种情况(偶×奇、奇×偶、偶×偶，都是偶数)

点数积为偶数的概率为27/36 = 0.75

当得到了新的信息：当第一枚骰子点数为奇数，求2枚骰子点数为偶数的概率

样本空间缩小

事件共有3×6=18种情况

只有当第二枚点数为偶数，2枚骰子点数的积为偶数

点数积为偶数共9种情况

点数积为偶数的概率为9/18=0.5

自行用条件概率表示一下

2.7.随机变量及其分布

条件概率公式

在事件A发生的条件下，事件B发生的条件概率；

P(AB)表示AB同时发生的概率

概率的乘法公式

A和B同时发生的概率 = 先发生一个，再在它的条件下发生另一个。

P(AB) = P(A)P(B|A)

对任意两个事件A、B，若P(A)＞0

因为该公式是由条件概率公式推到，所以需要P(A)＞0

需要注意的是，P(AB)描述的是“A、B同时发生”这一件事

P(AB) = P(A)P(B|A) = P(B)P(A|B)

全概率公式

把一个复杂事件，拆成好几块互斥又全覆盖的 “小情况”，分别算概率再加起来。

A1、A2、…、An是一组两两互斥的事件，A1∪A2∪…∪An = Ω

P(Ai) ＞ 0，i = 1, 2, …, n

B ⊆ Ω

这叼公式最难的是看懂符号

贝叶斯公式

概述

该公式由托马斯·贝叶斯(Thomas Bayes)与1763年发表，这哥们是个专职神学家，业余研究数学。阐述了“动态更新”的概率理论，即通过初始认知结合新证据不断修正判断。这一理念成为现代AI的底层逻辑。

贝叶斯定理，通过描述“两个事件的条件概率间的关系”，阐述了“动态更新”的概率理论，即通过初始认知结合新证据不断修正判断。这一理念成为现代AI的底层逻辑。

该公式用于"在有限的信息下，预测概率"，或"出现了某种现象，反推原因"

与数理统计的思想一致

是概率论里唯一一条能把“先验信息+观测数据”变成“后验概率”的公式。

虽然贝叶斯公式是一种结合“概率模型”和“统计推断”的方法，但数理统计的研究方法并不依赖贝叶斯公式

高考还算时常考到贝叶斯公式(考点为条件概率+全概率，等价于贝叶斯公式)，不过难度很低，且一般出现在选择填空或大题第一题。

"P(A)"：先验概率(Prior probablity)

表示在不知道现象B发生的前提下，先对"原因"P(A)成立的概率进行一个主观判断。

"P(B|A)/P(B)"：可能性函数(Likelyhood)

表示出现了新现象 P(B|A)/P(B)，可对"P(A)"进行调整

该函数是一个调整因子

如果P(B|A)/P(B)>1，意味出现了现象B，使得原因A成立的可能性变大；

如果P(B|A)/P(B)=1，意味着出现的现象B，对原因A成立的可能性没有帮助；

如果P(B|A)/P(B)<1，意味出现了现象B，使得原因A成立的可能性减小；

用于将先验概率"P(A)"（之前的主观判断）调整到更接近真实概率。

可能性函数中的"P(B|A)"是条件概率（见条件概率公式），表示当原因A成立时，出现现象B的概率

"P(A|B)"表示后验概率(Posterior probability)

表示出现了现象B后，对"原因A"成立的概率重新评估，调整后的概率。

举个例子

村里有且仅有两个小偷：贼1、贼2

据派出所案底统计，贼1偷东西可能性0.2、贼2偷东西可能性0.8

据观察，贼1偷盗成功概率0.6、贼2偷盗成功概率0.3

如果村里今天某家被偷了一件东西，判断贼1、贼2谁更有嫌疑，即判断两贼偷东西的可能性

抽象一下

0. 抽象

原因 A：贼偷东西

可能是贼1偷的，A1：贼1偷了，P(A1) = 0.2

可能是贼2偷的，A2：贼2偷了，P(A2) = 0.8

P(A1) + P(A2) = 1

东西被偷就2个可能，要么贼1偷了，要么贼2偷了

现象 B：某家被偷了一件东西

概况：在"某家被偷了一件东西"的现象下，调整贼1、贼2的偷窃可能性；并根据调整后的可能性，重新评估哪贼更有嫌疑

1. 条件概率：两贼偷盗成功的可能性

P(B|A1) = 0.6

P(B|A2) = 0.3

2. 某家被偷了一件东西的概率

要么贼1偷、要么贼2偷，可由全概率公式计算

P(B) = P(A1)P(B|A1) + P(A2)P(B|A2) = 0.2*0.6 + 0.8*0.3 = 0.36

3. A1和A2的嫌疑

P(A1|B) = P(B|A1)P(A1)/P(B) = 0.6*0.2/0.36 = 1/3

P(A2|B) = P(B|A2)P(A2)/P(B) = 0.3*0.8/0.36 = 2/3

4. 判断——贼2更有嫌疑，先把贼2抓来问问

随机变量

概述

如果说古典概型、几何概型是概率论的起点，全概率、条件概率是概率论的“逻辑”

随机变量将样本点映射为实数，连通了概率论与代数运算

随机变量令概率问题可以运算、证明、数学建模

随机变量将“随机试验的结果” 映射成 “实数”

不同于普通函数中的自变量可以人为赋值，随机变量的值是某个随机试验的结果(或概率)

建立从样本点到实数值的映射

离散型随机变量

连续型随机变量

用函数图像描述概率

概率分布列(分布列)、概率分布图

函数特性

均值(数学期望)、极差、方差、标准差

画函数图像，观察这些值在图像上的表示方法

二项分布

有放回抽样 / 独立重复试验

总体很大，不放回抽样可近似二项分布

当次数n很大时，二项分布可近似于正态分布

独立，每次抽取概率不变（或近似不变）

超几何分布

无放回抽样 / 有限总体里直接抽

不独立，每次抽取都会影响总体，导致概率变化

这个还是别用函数图像描述了

正态分布

也叫高斯分布，是最常见、最重要的一种连续型概率分布

大量独立、微小、随机的因素加在一起，结果就会趋近正态分布。

函数形状像一口钟，中间高、两边低、左右对称

大部分数据集中在平均值附近

离平均值越远，出现的概率越小

函数由两个参数完全决定

均值 μ：决定中心位置

标准差 σ：决定 “胖瘦”（越胖越分散）

8.数理统计

概述

数理统计是已知(或已统计)样本数据，从数据中反推分布、规律等

现实世界的生成机制通常未知或过于复杂，因此我们无法直接给出概率模型，只能通过样本数据去估计模型结构、参数以及变量之间的关系。因此需要做统计，并根据统计数据

判断使用哪种概率模型

求该概率模型中的相关参数，使得模型拟合数据

判断事件是否相关、相关程度

预测符合该模型结构的未发生的事件的概率

1.9.统计

抽样

抽样方法

简单随机抽样

总体中随机、无规律地抽个体

生物书提到的“标记重补法”就属于此

适用于总体数量少、个体之间差别不大、乱成一团等情况

分层抽样

总体有明显分层，按层比例抽

总体不均匀时（内部差异巨大，明显分成几类），防止有小概率样本严重偏斜，导致结果完全不准的情况

系统抽样

先编号，再等间隔抽

适用于大而均匀的总体

解决了总体较大时，简单随机抽样编号、抽签过于繁琐的问题

三种抽样方法可结合使用

从样本到总体

总体取值规律的估计

总体百分位数的估计

一组数据的第p百分位数，表示该组数据中至少有p％的数据小于或等于这个值，且至少有(100-p)％的数据大于或等于这个值

中位数就是第50百分位数

总体集中趋势的估计

平均数、中位数、众数

总体离散程度的估计

极差、方差、标准差

数据分析

数据的描述方式

茎叶图

频率分布表

频数分布直方图

频率分布直方图

数据的数字特征

衡量数据中心趋势

总体均值、样本均值

平均值

算术平均值

几何平均值

中位数、众数

衡量数据离散程度

极差、方差、标准差

变量(值)的相关关系

2.8.成对数据的统计分析

用于讨论现实生活中，两个变量的值是否有关系——这种关系可能不是函数那般有精确的对应关系，但这两个变量中的一个确实影响了另一个变量

散点图

通过观察散点图，初步判断变量是否有相关关系

线性相关

正相关

负相关

非线性相关

可能是不相关

也可能是其他相关关系

一元线性回归模型

该模型是一种用于描述样本的理想假设，其表达式Y = bx + a + e中，a、b、e均不可知——因此需要引入线性回归方程来拟合该模型

确定是否为一元线性回归模型→抽取样本→用样本数据估计模型中的a、b→得到线性回归方程 →用该方程拟合模型

表达式

Y = bx + a + e

E(e) = 0, D(e) = s2

Y关于x的一元线性回归模型

Y：因变量/响应变量

其值虽然不能由变量x的值确定，但是却能表示为 bx+a与e的和(叠加)；前一部分由x所确定，后一部分是随机的

x：自变量/解释变量

a、b：模型的位置参数

a：截距参数

b：斜率参数

e：Y与bx+a之间的随机误差

E(e) = 0：误差的数学期望为0

误差不会一直偏大，也不会一直偏小；平均下来正负抵消，等于 0

所以构建线性回归方程时不用考虑该误差(系统性偏差)

D(e) = s2：误差的方差为常数s2

误差的波动程度是均匀、稳定的。

这两条是使用最小二乘法构建线性回归方程的前提条件

样本相关系数 r

用数字判断线性相关强弱

该系数只能用于描述x和y近似成一条直线(线性相关)的程度

该系数不能描述除线性相关外的其他相关关系

常见相关关系还有二次相关、反比例相关、指数相关等等

线性回归方程中的决定系数R2用于衡量拟合程度，该值可以用来描述其他相关关系的强弱

该系数用于判断样本数据是否可以用一元线性回归方程拟合

r∈[-1, 1]

越接近 1：正相关越强

越接近0：相关性越弱

越接近 -1：负相关越强

线性回归方程

残差平方和 Q

描述样本（观测数据）与模型（直线y = bx +a）的拟合程度（整体接近程度）

Q为样本点(观测值)与构建的线性回归方程中对应点(预测值)的距离的平方的和

该距离成为“残差”

该值越小，说明拟合效果越好

需要通过样本点求出一组a、b，使Q取得最小值

使用最小二乘法求Q的最小值，从而得到a、b

残差平方和Q用来估计一元线性回归模型中的D(e)

决定系数 R2

决定系数用于描述方程(此处为线性回归方程)拟合模型(此处为一元线性回归模型)的程度

决定系数越大，表示残差平方和越小，即模型的拟合效果越好

右侧分子即为残差平方和Q

最小二乘法求线性回归方程

变量(类)的相关关系

如果是一元线性回归模型讨论的是变量值之间的关系（如人的身高与体重的关系），列联表与独立性检验则讨论两个不同类型变量之间的关系（如人的身高与骨质疏松症的关系）

2.8.成对数据的统计分析

2.8.3.列联表与独立性检验

分类变量

用数值将观察对象分到不同类别里的变量；该数值没有大小意义，只代表“属于哪一类”

如将男、女分别编号为1、0，将某学校初中生按班级编号为1、2、3、4……等

分类变量的统计和计算，是将某分类变量对应的频数进行统计和计算

高中一般只讨论取值于{0, 1}的分类变量的关联性问题

列联表

一种统计表，对两个分类变量及每类变量的值进行统计

每个分类变量的值只是“标签”，没有大小意义

每个分类变量经由统计出的个数/频数有大小意义，可用于计算

独立性检验

X2独立性检验

对于随机样本而言，因为频率具有随机性，频率与概率之间存在误差，所以我们的推断可能犯错误——现在需要一种方法，用于描述推断正确(或错误)的概率

利用列联表，进行一系列运算，判断两个分类变量是否有关系（有x%的可能有关系）

方法步骤

1.先进行零假设(H0)

假设两分类变量相互独立、没有关系

给定了两分类变量相互独立时的理论情况(理论频数)

2.用列联表统计

设两分类变量X、Y

分类变量X对应两种情况：X0、X1

P(X0) = X0所在行合计 / 总数

分类变量Y对应两种情况：Y0、Y1

P(Y0) = Y0所在列合计 / 总数

3. 计算理论频数

理论频数用于计算“每个格子本应有多少人”

如果两个分类变量独立，则每一行、每一列的比例应当均匀

理论频数A、B、C、D分别对应列联表中统计频次a、b、c、d

理论频数 = “该情况所在列联表中的”行合计 × 列合计 ÷ 总数

发生X0、Y0(即表中a格所在)的频率应当为 P(X0∩Y0) = P(X0)×P(Y0) = [(a+c)/n] ×[(a+b)/n]

理论频数A = n × P(X0∩Y0) = (a+c)(a+b)/n

同理求出B、C、D

2.使用c2计算实际频数于理论频数的差值

好消息是卡方公式、概率值、临界值不需要背，考题一般会附带给出，而且该考的的考题一般很简单，完全套公式即可。

简化公式

3.进行数据比较

P(c2 ≥ xa) = a

符号含义

a：概率值

概率值越小，则需要的临界值越大，判断是否相关越严格

该概率值是人为射灯的，如0.05表示有5%可能，0.001表示有1%可能

xa：a的临界值

初等数学中，临界值由设定的概率值查表得出；但在高等数学中，临界值是由卡方分布概率密度函数(通过积分)计算出的

卡方分布的概率密度函数(不需要了解)

卡方分布是一组相互独立且服从标准正态分布的随机变量的平方和

Γ(·)为伽马函数

n为自由度

2×2列联表，自由度 df = (2 - 1)×(2 - 1) = 1

n=1那条线

横轴为卡方统计量

纵轴为概率密度

临界值c2满足

从临界值往右，曲线下(与x轴围成)的面积 = α

此时函数横坐标x为临界值cα

如α = 0.05时，对应cα = 3.841；α = 0.001时，对应cα = 10.828

进行判断

判断依据

①如果两分类变量独立，则统计量应当服从卡方分布

②如果两分类变量不独立，则统计量不满足卡方分布

当c2 ＜ xa时，则没有重复证据推断H0不成立，可以认为X、Y独立

即c2落在概率密度函数预期位置的左侧

在假设判断依据①的前提下，数据落在了“大概率可能出现”的范围内，符合假设

当c2 ≥ xa时，推断H0不成立，X、Y不独立(即X、Y有相关性)，且该推断犯错误的概率不超过α

即c2落在概率密度函数预期位置的右侧

在假设判断依据①的前提下，数据落在了“小概率可能出现”的范围内，不符假设

那就不独立咯

需要注意：有相关性不代表存在因果关系

经统计，冰淇淋的销量和溺水死亡人数相关

冰淇淋销量越高时，溺水死亡人数越多

凭经验可判断，上述分类变量没有因果关系

可能由于天气热，导致冰淇淋效率高、游泳人数多→溺水死亡人数多

9.微积分初步

概述

初等数学注意研究静态的数

固定不变的数

静止的图形

匀速、恒定的量

有限、离散、确定的关系

微积分不再求解未知的数，转而求解未知的函数

函数可以完整描述过程的演变

变化的快慢（导数：瞬时速度、瞬时斜率）

连续变化的累积（积分：曲线下面积、变力做功）

无限逼近、极限过程

微分初步

2.5.一元函数的导数及其应用

微分学的核心思想在于宏观的、全局性的变化，是由无数个微观的、局域性的“变化倾向”累积而成的。

导数

定义和几何意义

导数的运算

函数求导

常函数

幂函数，(xu)' = uxu-1

三角函数

(sin x)' = cos x

(cos x)' = -sin x

(tan x)' = sec2 x

(cot x)' = -csc2 x

(sec x)' = sec x · tan x

(csc x)' = -csc x · cot x

高中三角函数导数可能只要求掌握前四个

指数函数，(ax)' = axln a (a＞0, a ≠ 1)

对数函数，

导函数的四则运算

复合函数的导函数

导数的应用

通过导数判断函数的

单调性

极值

闭区间上的最值

简单实际问题

面积、体积、利润的最大/最小

积分初步

定积分

几何意义

微积分基本定理（牛顿 — 莱布尼茨公式）

用定积分算：简单曲线围成的面积

好像没学？