国际电气工程先进技术译丛
决策用强化与系统性
机器学习
他印度?巴拉格?库尔卡尼o?U?Uk???U??=d ?著
李 ?宁 ?吴 ?健 ?刘 ?凯 ?等译
机械工业出版社
? ?机器学习是人工智能领域中一个极其重要的研究方向%强化学习是机
器学习中的一个重要分支%作为解决序贯优化决策的有效方法?强化学习
有效地应用于计算科学&自动控制&机器人技术等各个领域%
当前?强化学习的核心任务是提高学习效率?本书就是针对此问题展
开的%第?章介绍系统概念和增强机器学习?它建立了一个突出的相同的
机器学习系统范例+第0章将更多关注机器学习的基本原理和多视角学
习+第章关于强化学习+第?章处理机器学习系统和模型建立的问题+
决策推理等重要的部分将在第"章展开+第章讨论了自适应机器学习+
第?章讨论了多视角和全局系统性机器学习+第 章讨论了增量学习的需
要和知识表示+第 章处理了知识增长方面的问题+第?!章讨论了学习
系统的建立%
本书适合于机器学习&自动化技术&人工智能等方面的相关专业教师
与研究生阅读?也可供自然科学和工程领域相关研究人员参考%
译 ?者 ?序
? ?进入0?世纪以来w人们对机器学习o]U?d=? U??=?kd的期望与日俱增
十年前所想的智能系统如今只是被认为是个普通系统而已人们都希望机器变得
更加智能w能自主地学习并具备高效的解决日常问题的复杂行为的能力机器学
习的应用不局限于一种特定的领域w而是分布在所有领域
强化学习o? =????? ] ?w U??=?kw又称再励学习评价学习d是一种重要的
机器学习方法w在智能控制机器人及分析预测等领域有许多应用但在传统的机
器学习分类中没有提到过强化学习w而在连接主义学习中w把学习算法分为三种
类型w即非监督学习o???q ??= ? U??=?kd监督学习o?q ??= ? U?=?kd和
强化学习
强化学习由统计学控制理论心理学等相关学科发展而来w经过多年的发
展w已经成为解决序贯优化决策的一种有效方法所谓强化学习就是智能系统从
环境到行为映射的学习w以使奖励信号o强化信号d函数值最大强化学习中
由环境提供的奖励信号是对产生动作的好坏做一种评价w并非直接告诉强化学习
系统o? =????? ] ?w U??=?k?w ]d如何去执行正确的动作由于外部环境提供
的信息很少w强化学习系统必须靠自身的经验知识进行学习通
决策用强化与系统性机器学习=Reinforcement and Systemic Machine Learning for Decision Making_ [印度]巴拉格·库尔卡尼(Parag Kulkarani)(著), 李宁, 吴健,刘凯(译).pdf