如何利用matlabmatlab求解动态规划划求最优控制

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>matlab >>如何利用matlabmatlab求解动态规划划求最优控制

如何利用matlabmatlab求解动态规划划求最优控制

来源：蜘蛛抓取(WebSpider) 时间：2016-10-01 05:26 标签： matlab求解动态规划

 上传我的文档
 下载
 收藏
该文档贡献者很忙，什么也没留下。
 下载此文档
正在努力加载中...
最优控制_第七章_动态规划法
下载积分：2000
内容提示：最优控制_第七章_动态规划法
文档格式：PPT|
浏览次数：0|
上传日期： 05:45:26|
文档星级：
该用户还上传了这些文档
最优控制_第七章_动态规划法
官方公共微信[转载]动态规划的Matlab实现和实例分析&摘自matlabsky
动态规划是解决多阶段决策过程最优化问题的一种方法．
该方法是由美国数学家贝尔曼(R．Bellman)等人在2O世纪50年代初提出的．他们针对多阶段决策问题的特点，提出了解决这类问题的最优化原理，并成功地解决了生产管理、资源分配等方面的许多实际题，从而建立了运筹学的一个新分支——动态规划．
动态规划是现代企业管理中的一种重要决策方法，可用于解决最优路径、资源分配、生产计划与库存、投资、装载、排序等问题，还可用于生产过程的最优控制等．由于它有独特的解题思路，因而在处理某些优化问题时，比线性规划或非线性规划方法更有效．
而Matlab是一个功能强大的用于基于矩阵运算的强大数值计算软件，将Matlab语言应用到动态规划中去，对实际问题进行程序设计和计算，可以达到计算简便的目的．
一、动态规划基本概念
使用动态规划方法解决多阶段决策问题，首先要将实际问题写成动态规划模型，此时要用到以下概念：
将所给问题的过程，按时间或空间特征分解成若干互相联系的阶段，以便按次序去求解每阶段的解，每个阶段就是一个子问题，常用字母k表示阶段变量．
2)状态各阶段开始时的客观条件叫做状态．描述各阶段状态的变量称为状态变量，常用sk表示第k阶段的状态变量．状态变量sk的取值集合称为状态集合，用sk表示．
3)决策当各段的状态取定以后，就可以作出不同的决策(或选择)，从而确定下一阶段的状态，这种决定称为决策．表示决策的变量称为决策变量，常用uk(sk)表示第k阶段当状态为sk时的决策变量．在实际问题中，决策变量的取值往往限制在一定范围内，称此范围为允许决策集合，常用Dk(sk)表示第k阶段从状态sk出发的允许决策集合，显然有“uk∈Dk(sk)．
一个由每个阶段的决策按顺序组成的集合称为策略，用p表示，即p(s1)={u1(s1),u2(s2),.......,un(sn),}。一个n阶段决策过程，从1到n叫作问题的原过程．对于任意给定的k(1≤k≤n)，从第k阶段状态sk到第n阶段状态sn的过程称为原过程的一个后部子过程．后部子过程的策略记为pk(sk)={uk(sk),uk+1(sk+1),......,un(sn)}，在实际问题中，可供选择的策略有一定的范围，此范围成为允许策略集合。允许策略集合中达到最优效果的策略成为最优策略
5)状态转移动态规划中本阶段往往是上一阶段状态和上一阶段的决策进行综合的结果．如果给定了第k段的状态sk，且该阶段决策为uk(sk)，则第k+1段的状态sk+1也就完全确定．它们的关系可表示为：
sk+1=Tk(sk,uk)
由于上式表示了由k阶段到k+1阶段的状态转移规律，所以称该式为状态转移方程．
6)指标函数
用于衡量所选定策略优劣的数量指标称为指标函数．一个n阶段决策过程，从1到n叫作问题的原过程．对于任意一个给定的k(1≤k≤n)，从第k阶段到第n阶段的过程称为原过程的一个后部子过程。V1,n(s1,p1,n)表示初始状态为s1采用策略p1,n时原过程的指标函数值。而Vk,n(sk,pk,n)表示在第k阶段，状态为sk采用策略pk,n时后部子过程的指标函数值．最优指标函数记为fk(sk)，它表示从第k阶段状态sk采用最优策略pk,n到过程终止时的最佳效益值．fk(sk)与Vk,n(sk,pk,n)间的关系为：
fk(sk)=Vk,n(sk,pk,n)=optimize&&Vk,n(sk,pk,n)
当k=1时，f1(s1)就是从初始状态s1到全过程结束的整体最优函数．
二、动态规划基本思路
1)将多阶段决策过程划分阶段，恰当地选择状态变量、决策变量以定义最优指标函数，从而把问题化成一族同类型的子问题，然后逐个求解．
2)求解时从边界条件开始，逆序过程行进，逐段递推寻优．在每一个子问题求解时，都要使用它前面已求出的子问题的最优结果．最后一个子问题的最优解，就是整个问题的最优解．
3)动态规划方法是既将当前一段与未来各段分开，又把当前效益和未来效益结合起来考虑的一种最优化方法，因此每段的最优决策选取是从全局考虑的，与该段的最优选择一般是不同的．
三、动态规划函数使用说明
由于我们的目的是使用动态规划解题，而不是要我们直接编写动态规划的程序，那我们下面直接给出一个现成的动态规划的MATLAB源代码，这里不讨论它到底是是如何运行的，我们只是说明下该函数如何使用
[p_opt,fval]=dynprog(x,DecisFun,ObjFun,TransFun)&
自由始端和终端的动态规划,求指标函数最小值的逆序算法递归计算程序
x各阶段状态变量的可能取值，第k列代表第k阶段状态变量可能取值
DecisFun(k,x)决策函数，由阶段k的状态变量x求出相应的允许决策变量
ObjFun(k,x,u)阶段指标函数
TransFun(k,x,u)状态转移函数，其中x是阶段k的某状态变量，u是相应的决策变量
p_opt动态规划的规划过程，p_opt=[阶段序号，状态变量，决策变量，指标函数]
fval总目标函数值，是一个列向量，第i元素代表第一个状态变量取第i个可能值时的总目标
该函数的参见【数学建模工具箱】
四、动态规划实例分析
某公司拟将某种设备5台分配给甲、乙、丙3个工厂，各工厂利润与设备数量之间的关系如下表所示，问这5台设备如何分配使3个工厂的总利润为最大?
应用动态规划方法分析如下
将问题按工厂分为3个阶段，k=1,2,3
给第k个工厂分配前拥有的设备台数，显然s1=5
分配给第k个工厂的设备台数，显然
分给第一个工厂可以0到s1台之间
分给第二个工厂也可以0到s2台之间
分给第三个工厂的为s2台
u=decisfun(k,s,u)
4.状态转移Tk
前后两个状态之间的关系如下
s2=s1-u1，s3=s2-u2
s_next=transfun(k,s,u)
s_next=s-u
5.阶段指标Vk
第k阶段的指标函数，表示配给第k个工厂uk台设备所获得的利益，显然
Vk=w(uk,k)
V=subobjfun(k,s,u)
13 11 12];
w=-w;%由于函数只能求最小值，现在求最大值，故取符号
%第k阶段，决策变量为u时，对应的目标值
V=([0 1 2 3 4
5]==u)*w(:,k);%或者直接使用V=w(u,k)
6.各阶段状态变量可能取值
由已知，我们容易知道
s2={0,1,2,3,4,5}
s3={0,1,2,3,4,5}
s=nan*ones(6,3);%没有取值的地方使用nan代替
s(:,2)=[0 1 2 3 4
s(:,3)=[0 1 2 3 4 5]’;
根据上面的分析，我们编写程序如下
%动态规划函数求解问题演示实例
%by dynamic
%计算各状态变量可能取值，第k列代表第k个状态变量的可能取值，没有的使用NaN代替
s=nan*ones(6,3);
s(:,2)=[0 1 2 3 4
s(:,3)=[0 1 2 3 4
%直接调用dynprg函数
[p_opt,fval]=dynprog(s,@DecisFun,@ObjFun,@TransFun)&
u=DecisFun(k,s,u)
s_next=TransFun(k,s,u)
%状态转移函数
s_next=s-u;
V=ObjFun(k,s,u)
%阶段目标函数
13 11 12];
w=-w;%由于函数只能求最小值，现在求最大值，故取符号
%第k阶段，决策变量为u时，对应的目标值
V=([0 1 2 3 4
5]==u)*w(:,k);%或者直接使用V=w(u,k)
运行结果如下
这个运行结果解读如下，我们要一行一行的解读
对于p_opt：
第一阶段，状态变量为5，决策变量为2，阶段指标为-7，也就是说第一阶段时有5台设备，分配给第一个工厂2台，该工厂的利益为-7
第二阶段，状态变量为3，决策变量为2，阶段指标为-10，也就是说第二阶段时有3台设备，分配给第二个工厂2台，该工厂的利益为-10
第三阶段，状态变量为1，决策变量为1，阶段指标为-4，也就是说第三阶段时有1台设备，分配给第三个工厂1台，该工厂的利益为-4
对于fval：
总指标值为-21=-7-10-4，也就是说按上面的最优策略，将最大获利21
后面的那些NaN是由于第一个状态变量的可能取值我们只是输入了5，而其他可能值都是用NaN的，故没有结果
当然第一个状态变量的可能取多个值，dynprog可以求解第一个状态变量多取值的情况。可是根据该题实际我们只有一个5。下面我们试试，假如s={4
5}的运行结果
%计算各状态变量可能取值，第k列代表第k个状态变量的可能取值，没有的使用NaN代替
s=nan*ones(6,3);
s(1:2,1)=[4,5];
s(:,2)=[0 1 2 3 4
s(:,3)=[0 1 2 3 4
%直接调用dynprg函数
[p_opt,fval]=dynprog(s,@DecisFun,@ObjFun,@TransFun)
运行结果如下，至于结果的解读，大家可以根据dynprog函数的说明试试看看，能否明白
如果没法理解，可以与我一起探讨下
摘自matlabsky：参考网址：
以上网友发言只代表其个人观点，不代表新浪网的观点或立场。path-planning4 用matlab编写的程序用来求解动态规划最短路径问题，该方法能够快速有收敛到全局最
254万源代码下载-
&文件名称: path-planning4& & [
& & & & &&]
&&所属分类:
&&开发工具: matlab
&&文件大小: 2 KB
&&上传时间:
&&下载次数: 41
&&提供者:
&详细说明：用matlab编写的程序用来求解动态规划最短路径问题，该方法能够快速有效的收敛到全局最优解。-Programs written using matlab to solve the dynamic programming shortest path problem, the method can converge quickly and effectively to the global optimal solution.
文件列表(点击判断是否您需要的文件，如果是垃圾请在下面评价投诉):
&&基于matlab的动态规划！非常好用！但运行比较麻烦\dongtai.m&&基于matlab的动态规划！非常好用！但运行比较麻烦
&[]:文件不全&[]:文件不全&[]:很好，推荐下载
&近期下载过的用户:
&输入关键字，在本站254万海量源码库中尽情搜索：
&[] - 用matlab编写的人工势场法路径规划算法演示程序，可以手动绘制障碍物，实现避障和对目标的跟踪，保证可以运行
&[] - 一些关于求解路径规划的，人工势场法，大家看看
&[] - 本书为《计算机算法导引――设计与分析》的第2版。书中内容分3部分：第1部分是基本算法，按方法论区分，包含优先策略与分治策略、动态规划、概率算法、并行算法、搜索法、数据结构等；第2部分是若干专题，包括排序算法、计算几何及计算数论、线性规划；第3部分是复杂性理论与智能型算法，其中，智能型算法主要介绍了遗如何用 MATLAB 获得动态规划问题的最优解_百度知道动态规划求解方法的Matlab实现及应用_于斌_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
动态规划求解方法的Matlab实现及应用_于斌
上传于||文档简介
&&文章对动态规划问题的求解方法进行了分析研究,根据问题的特点、难点和关键点做了针对性的处理,然后用Matlab做了实现尝试,从而实现了“最佳组队”和“最短路线”等问题的求解。实践证明所采用方法和程序都是有效的
阅读已结束，如果下载本文需要使用1下载券
想免费下载本文？
定制HR最喜欢的简历
下载文档到电脑，查找使用更方便
还剩1页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢

如何利用matlabmatlab求解动态规划划求最优控制

我要回帖

更多关于 matlab求解动态规划的文章

随机推荐

如何利用matlabmatlab求解动态规划划求最优控制

我要回帖

更多关于 matlab求解动态规划 的文章

随机推荐

更多关于 matlab求解动态规划的文章