导图社区
这是一篇关于抽样与参数估计的思维导图,其内容主要从抽样分布,参数估计以及样本量的确定这三个方面的2内容讲述
这是一篇关于第十讲 离散事件系统与仿真的思维导图,主要内容有概念、基本元素、部件与结构等。
马尔可夫决策过程(Markov Decision Process, MDP)是序贯决策(sequential decision)的数学模型,用于在系统状态具有马尔可夫性质的环境中模拟智能体可实现的随机性策略与回报 。MDP的得名来自于俄国数学家安德雷·马尔可夫(Андрей Андреевич Марков),以纪念其为马尔可夫链所做的研究
社区模板帮助中心,点此进入>>