博弈论中的最优控制模型

博弈论中的最优控制模型

一、博弈论中的一个优化控制模型(论文文献综述)

王军,曹雷,陈希亮,赖俊,章乐贵[1](2021)在《多智能体博弈强化学习研究综述》文中提出使用深度强化学习解决单智能体任务已经取得了突破性的进展。由于多智能体系统的复杂性,普通算法无法解决其主要难点。同时,由于智能体数量增加,将最大化单个智能体的累积回报的期望值作为学习目标往往无法收敛,某些特殊的收敛点也不满足策略的合理性。对于不存在最优解的实际问题,强化学习算法更是束手无策,将博弈理论引入强化学习可以很好地解决智能体的相互关系,可以解释收敛点对应策略的合理性,更重要的是可以用均衡解来替代最优解以求得相对有效的策略。因此,从博弈论的角度梳理近年来出现的强化学习算法,总结当前博弈强化学习算法的重难点,并给出可能解决上述重难点的几个突破方向。

王玙[2](2020)在《现代有轨电车车载混合储能系统能量管理策略及容量配置优化研究》文中认为现代有轨电车具有编组灵活、造价低廉、外形美观等优点,已成为了城市轨道交通的重要组成部分。近年来,现代有轨电车的新型无接触网供电技术得到日益广泛的应用,其中,车载储能式供电是广受欢迎的无接触网供电方式之一。本文以兼具高功率密度与高能量密度的电池-超级电容车载混合储能供电技术为对象开展相关研究,主要研究内容如下:(1)为了充分发挥电池与超级电容优势互补的特点,本文提出了一种基于电池与超级电容能量交互的固定功率比例分配策略。该策略在传统的规则策略的基础上,考虑有轨电车部分区间能耗大的运行需求,在超级电容电压低于设定阈值的情况下,进入电池主动状态,实现电池与超级电容之间的能量转移,使混合储能系统实现稳定的高功率输出,并能够有效降低储能系统的配置重量。(2)提出了现代有轨电车混合储能系统能量管理策略与容量配置的三步式协同优化方法。第一步为能量管理策略的改进,即基于能量交互的固定功率比例分配策略的提出。第二步为能量管理策略参数的多目标优化,通过拆解优化过程,清晰地展现能量管理策略与容量配置的联系和对系统性能的影响,克服了通过优化算法进行单步配置易陷入局部最优的缺陷。第三步为容量配置的最终优化,基于优化后的策略参数,通过改进的粒子群算法得到电池寿命与系统重量的多目标最优配置结果。本文通过案例仿真分析,验证了该配置方法的优势。同时,为了解决前期设计中计算效率低的问题,本文开发了一套能量管理策略与容量配置优化软件,可快速完成车载储能系统容量配置优化及能量管理策略验证,并基于该软件,进行了参考供电方式的快速分析。(3)提出了有轨电车的运行工况构建方法,并进行了有轨电车行驶工况的区域性特征分析。有轨电车具有多路权模式、线路固定、运行灵活的特点,兼具城轨车辆与非轨道交通车辆的运行特性。本文借鉴电动汽车的工况分析方法,通过主成分分析及K-均值聚类构建有轨电车的行驶工况,把有轨电车的工况分成了拥堵工况、畅通工况与高速工况三类。同时,基于有轨电车运行规则性强的特点,根据线路条件对有轨电车运行区域进行划分,并通过数据统计进行各工况下的短行程归属分析,判断各区域是否具有明显的工况特征。通过工况构建与区域划分,能够利用有轨电车的运行特点对混合储能系统进行深度优化,进一步提升供电系统的运行效率,实现电气化铁路节能的目标。(4)为了实现混合储能系统的效率提升和电池的寿命延长,本文提出了具有实时优化效果的工况自适应的能量管理策略。工况自适应策略由滚动优化策略和规则型策略组成,其中滚动优化策略通过小波神经网络进行有轨电车的状态预测,并基于动态规划算法进行功率分配的优化。工况自适应策略充分利用了有轨电车运行过程中的工况分析成果与区域性特征,结合了规则型策略和算法型策略的优点,既能够接近全局最优策略的优化效果,又能够实现对策略的简化,保证混合储能系统的稳定运行,方便工程应用。(5)为了验证本文的研究内容,搭建了90k W电池-超级电容混合储能样机,基于本文所提出的运行策略与充电策略,对混合储能系统进行了控制方案的设计与实验,验证系统的动态特性。并对本文所提出的能量管理策略进行了实验验证,证明策略的有效性和工程应用价值。

葛恒清[3](2020)在《基于PSO算法的煤矿通风系统优化与调控》文中指出我国现有煤层绝大多数都远离地表,这些煤层都必须采用井下开采方式,而井下开采方式必须建立安全可靠的煤矿通风系统。通风系统是确保煤矿安全生产的重要设施,也是煤矿企业的主要耗能耗资部分。煤矿通风系统稳定、安全、高效运行对煤矿安全生产、节能减排和降低成本都具有重要的意义。首先,分析了煤矿通风系统在煤矿安全生产中的重要地位,阐述了优化调控对煤矿安全、节能减排和提高管理水平重要意义。针对通风安全需求,提出稳风倒机方法,建立主通风机侧等效模型和稳风倒机优化控制模型;基于图论,构建了复杂通风网络按需分风增阻能耗优化调节模型,以及以调压、调阻的混合型调控方式,提出了混合型复杂通风网络能耗、建设投资成本以及改造利润损失的多目标优化调控方法,构建了混合型复杂通风网络多目标优化调节模型。其次,针对传统算法无法满足复杂通风网络这种大规模、多变量、多约束、多峰、非线性非凸的复杂问题求解,提出改进粒子群算法对复杂通风系统进行优化调控。借鉴集成系统的层次结构和生物行为异质性,提出采用层次结构和粒子异质行为的新型扩展层次异质粒子群算法EH2PSO,以“求精”“发现”因子扩展粒子探索能力,以分层结构增强粒子间信息共享能力,基于种群拥挤或早期停滞检测选择粒子异质行为,以标准PSO(SPSO)等5种PSO算法构建异质行为池。并经基准函数对EH2PSO的算法进行测试与比较研究,证明算法性能优越性。再次,根据建立的稳风倒机模型,提出了基于Fuzzy-PID的稳风倒机控制策略,建立稳风倒机模糊推理规则;提出了基于约束规划的稳风倒机控制策略,研究了约束规划风门角度调整歩长区间对井下风量变动影响;提出了基于EH2PSO算法控制的煤矿主通风机稳风倒机方法。结果证明基于EH2PSO算法控制的煤矿主通风机稳风倒机方法能够保持井下风量变动最小(小于0.8%)。开发了稳风倒机控制系统并经实际应用证明倒机过程井下风量稳定。另外,基于知情解引导粒子快速收敛于全局最优解的算法改进思想,提出在SMPSO算法种群引入角点解形成Corner-SMPSO。在角点解的求取上,提出将多目标转化为双目标优化的方法进行求取,并就不同的Pareto前沿类型,探讨了角点解的求解方法及其有效性,形成双目标SMPSO求解多目标问题角点解方法;基于DLZT系列基准函数,就Corner-SMPSO算法,引入角点解与否、引入时间进行比较研究,证明了引入角点解后多目标搜索算法性能在收敛速度和求解精度上有较大幅度提升,且引入角点解时间不同对算法性能改进没有明显影响。最后,提出基于EH2PSO算法的复杂通风网络能耗优化调控方法。经与采用Clerc’s Constricted PSO等三种PSO算法的优化调控对比研究,结果表明:采用EH2PSO算法进行优化,较其他三种算法求解速度快、精度高,能够使多风机混合型复杂通风网络功耗最低。提出了基于Corner-SMPSO算法的混合型复杂通风网络多目标优化调控方法。综合考虑通风网络通风能耗、建设投资成本和因改造导致的停产利润损失,以国内多风机混合型通风网络为实例,采用Corner-SMPSO算法对混合型复杂通风网络进行多目标优化,求取最优解集为煤矿通风网络运行管理提供决策依据。实验结果提供多目标优化调控解集,供煤矿企业决策选择。论文有图50幅,表31个,参考文献147篇。

郑建华[4](2020)在《电动汽车驾驶性评价及多目标优化控制研究》文中进行了进一步梳理由于环境污染问题的加剧、原油价格的上涨以及严苛的排放标准,电动汽车逐渐成为行业发展的重点之一。驾驶性是电动汽车在行驶过程中的动态特性之一,且驾驶性在电动汽车各项性能指标中比重逐渐提高。当前电动汽车控制研究多集中于改善动力性和提高能量利用效率方面,对驾驶性及其与动力性、经济性之间的耦合关系和控制规律研究较少。电动汽车驾驶性、经济性、动力性三者均由电动汽车驱动策略和换挡策略所决定,要对三者进行协同优化,就需要在优化过程中对控制策略和换挡策略进行调整。本文根据电动汽车电机驱动的特性,建立电动汽车控制策略和换挡规策略参数化调整方法,在此基础上对电动汽车的驾驶性,经济性,动力性的多目标优化控制展开研究。本文的主要研究内容如下:(1)建立电动汽车驱动策略和换挡策略参数化调整方法。将电动汽车驱动策略表示为转矩负荷系数随加速踏板开度变化的曲线。计算经济性驱动策略下的转矩负荷系数,计算动力性驱动策略下的转矩负荷系数。在两种驱动策略的基础上引入负荷调节因子K1,建立调整后的转矩负荷系数与负荷调节因子、经济性转矩负荷系数和动力性转矩负荷系数之间的关系。采用类似的方法,基于驱动策略参数化调整方法,引入负荷调节因子K2,建立换挡策略参数化调整方法。(2)建立电动汽车的客观评价方法。对电动汽车驾驶性评价的典型工况进行分析,选取表征电动汽车驾驶性的客观评价指标。基于BP神经网络建立驾驶性神经网络评价模型。选取纯电动汽车的动力性,经济性的客观评价指标,建立经济性,动力性的客观评价方法。(3)基于目标车型试验数据,搭建匹配CVT的纯电动汽车Matlab/Simulink仿真模型。主要包括:驾驶员模型,驱动策略模型,驱动电机模型,动力电池模型,CVT换挡策略模型,传动系统模型,车辆纵向动力学模型,客观评分模型(驾驶性神经网络模型,动力性,经济性)。(4)Pareto原理的多目标优化控制。在整车模型和驱动策略以及换挡策略参数化调整方法的基础上,选择相应的工况进行仿真研究。对Pareto最优解集进行研究,通过仿真过程中对K1、K2的调整,得到Pareto最优控制曲面以及负荷调节因子K1、K2的最优控制区间。实现电动汽车的驾驶性,经济性,动力性之间的多目标优化控制。

肖传亮[5](2020)在《基于集群划分的主动配电网电压控制与优化调度》文中认为随着传统能源的紧缺与电力需求的不断增长,能源开发结构日益趋向多元化,光伏(photocoltaic,PV)作为一种清洁可再生能源,已成为主要的能源发展方向之一。分布式光伏规模化接入配电网后,促使配电网中光伏发电比例不断提高,改变了传统配电网的单向潮流流向特性,使配电网过电压问题愈发严重,影响配电网的安全稳定与经济运行。此外,高比例分布式光伏规模较大、位置分散、数量众多、出力具有不确定性,这些特点极大地增加了配电网电压控制的复杂程度,对配电网的安全稳定与经济调度提出了新的挑战。本文针对上述问题,开展了相应的电压控制与优化调度研究工作:(1)建立无功/有功平衡度指标与区内节点耦合度指标,结合模块度函数指标,提出了一种基于改进模块度函数的集群划分算法,以此对含高比例分布式光伏的配电网进行无功与有功两个层面的集群划分。在光伏集群划分的基础上,基于光伏逆变器有功与无功的控制能力,提出“先无功后有功”的电压控制策略,在各集群内部通过控制关键光伏节点调节关键负荷节点的电压,从而实时控制电压。(2)提出了一种日前最优调度与实时控制相结合的配电网两层优化调度策略。其中,上层根据光伏出力与负荷需求的预测结果,利用改进的模块度函数对配电网进行集群划分,在此基础上以配电网运行成本最低为目标制定配电网日前最优调度计划。下层在日前调度计划与集群划分的基础上,利用配电网实时运行数据,以最大化追踪日前调度计划为目标制定集群内实时电压控制策略,实现对含高比例分布式光伏的配电网实时电压控制,以此完成实时电压控制与日前最优调度相结合,实现不同时间尺度下调度手段的配合。(3)针对高比例分布式光伏出力的波动性、随机性给电力系统电压控制与优化调度带来的困难与挑战,提出了一种计及光伏出力不确定性与集群划分的配电网双层优化调度策略。在利益主体并行优化层,利用改进的模块度函数对配电网进行集群划分,将光伏所有者分为PV无功、有功利益主体,与电力公司利益主体结合形成配电网多利益主体。针对PV无功/有功利益主体内,分别提出基于博弈论的光伏鲁棒优化调度模型;针对电力公司利益主体,提出基于二阶锥规划的优化调度模型,采用并行计算方法求解各利益主体的调度模型。在利益主体博弈优化层,针对各利益主体建立非合作博弈协调模型,并采用迭代搜索法求解Nash均衡点,实现各利益主体之间协调优化,以此实现考虑光伏出力不确定性条件下的配电网优化调度。(4)针对配电网中存在的多重不确定性对配电网经济调度带来的问题,提出了计及源-荷与集群划分多重不确定性的配电网三层优化调度策略。在集群动态调整层,通过集群动态调整对配电网中各利益主体划分进行更新,并将利益主体划分结果输送至利益主体并行优化层;在利益主体并行优化层,针对PV有功/无功利益主体建立考虑源-荷不确定性的集群内两阶段鲁棒优化模型,针对电力公司利益主体建立考虑网络优化重构的配电网线性优化调度模型,对各利益主体调度模型并行优化,快速得到各利益主体优化结果,并将优化结果输送至利益主体博弈优化层;在利益主体博弈优化层,交换各利益主体的优化结果并返还至集群动态调整层与利益主体并行优化层进行下一代优化计算,当集群划分结果与各利益主体内调节费用不再发生改变时,即为本策略下最优调度方案。所提策略能克服基于博弈论的鲁棒优化模型中只能对单一不确定性建模的局限性,解决源-荷不确定性及网络拓扑变化带来的集群划分不确定性问题,实现配电网中多种调压装置与网络拓扑变化的协调优化,快速地得到配电网的经济调度方案。本文提出的基于集群划分的配电网电压控制与优化调度方法为解决高比例分布式光伏接入配电网后产生的过电压控制以及经济调度问题提供理论参考,对高比例分布式光伏的友好并网、实现电网与光伏的长久协调发展以及未来电力系统的创新型运作管理方式等具有重要参考价值。

吴楠[6](2019)在《能源互联网环境下的微电网优化管理控制策略研究》文中指出在全球节能减排与环境保护的大背景下,电力系统开始大量采用以风力发电和太阳能发电等为代表的可再生新能源来逐步地降低,甚至取代对化石能源发电的依赖。由于以风力发电、太阳能发电和瓦斯发电等为代表的分布式电源不易远距离传输且采用的是就近消纳的运行模式,所以要实现分布式电源管理的理想方案就是组建能源互联网下的微电网,在微电网中对这些分布式电源进行优化调度管理与控制,这不仅可以优化微电网内能源配置,而且有利于电力系统节能减排目标的实现。对于微电网的能源管理问题,由于微电网中分布式能源具有间歇性和实时变化性且不能像火电一样人为控制发电量和发电装机容量的稳定性,所以传统电网能源管理控制方式并不适用于解决微电网的能源管理控制问题。为了对微电网中的分布式能源进行有效的管理控制,论文展开了在能源互联网背景下的微电网实时优化管理控制策略研究。首先,针对微电网中分布式能源各自的特性,建立了分布式电源的成本模型和约束条件数学表出。然后,根据分布式电源成本模型和约束条件,建立了微电网能源管理控制成本优化模型,并利用该模型进行微电网能源优化管理控制研究。其次,在微电网能源管理控制成本优化模型的基础上,将最优控制理论引入到微电网能源管理中,提出了微电网分布式实时能源管理框架,并为该框架提出了深度学习自适应动态规划算法,有效的解决了微电网的能源管理调度实时性问题。通过从电网公司得到的历史数据带入模型进行仿真验证,得到了满意的统计分析结果,进而验证了所建模型和算法的有效性、实时性和稳定性。再次,针对在微电网能源优化管理控制中由于可再生能源发电量不足以满足网内用户需求展现出的切除柔性负荷情况,将需求响应、实时电价理论引入到微电网的能源需求侧响应管理优化中,不仅实现了微电网的供需动态平衡和削峰填谷,而且使得能源管理控制策略变得更加合理确保了微电网的稳定运行。通过对微电网需求侧响应下实时电价管理控制模型进行仿真,验证了其在微电网能源管理控制中的有效性和可行性。最后,由于微电网在其运行过程中不可避免地会受到一些不确定因素如负荷扰动、天气变化等的影响,以及由于所建立模型的不精确性、传感装置的测量误差和数学模型的参数误差等,这些不确定性或广义干扰都可能使实际控制效果趋于恶化,而使得最优控制策略难以获得。但演化博弈论只要求微电网中的局中人(系统决策者和不确定性作为虚拟参与者)具有有限理性即可,论文将有限理性两个逼近定理用于微电网能源管理控制中,同时根据这两个有限理性逼近定理提出了其在电力市场中的应用条件,并且证明了实时能源管理控制策略是有限理性逼近完全理性的一个具体应用,进而进一步阐明了该实时能源管理控制策略就是可行的最优管理控制策略。此外,通过将论文研究的微电网能源管理控制策略带入到南方电网公司某区域微电网中进行仿真验证,分析结果表明具有实时性的能源管理控制策略更加符合分布式多源供电的微电网能源管理调度。论文以工业工程与管理中的微电网需求侧响应管理实时调度优化控制问题作为研究对象,通过采用复杂性科学优化决策的相关理论,解决了微电网中能源需求侧响应管理的实时调度问题,为微电网需求侧用电管理提供了理论和方法上的支持。同时,文中提出的微电网实时能源管理控制策略符合当前电力系统绿色能源整体发展方向,有助于电力系统提高区域微电网内分布式电源的利用率,在不降低电力需求的条件下,有效地降低了由于大量使用化石能源而带来的碳排放和环境污染问题,有利于实现使用清洁能源的节能减排既定目标。

王功明[7](2019)在《深度信念网络结构优化设计方法与应用》文中认为深度学习(Deep learning,DL)本质上是指一类对具有深层结构的人工神经网络进行训练的方法,是一种模拟脑神经系统对感知信号进行分层处理的深层结构。深度信念网络(Deep Belief Network,DBN)是为了简化逻辑斯蒂信念网络的推理困难而提出的一种深度模型,也是目前DL最主要的实现方式之一。DBN由若干个受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)顺序堆叠来构造,其学习过程分为两个阶段,首先对RBM进行逐层无监督预训练,再用反向传播算法对整个网络进行有监督的调优。DBN的这种分阶段训练方法使其在学习深层结构上取得了一定的成功,并在图像处理、声音辨识、自然语义理解及回归和预测等任务中得到了关注和研究。然而,目前的DBN在处理实际复杂数据时,无监督预训练和反向传播(Back Propagation,BP)调优算法均显现出了不足,主要表现在预训练耗时长和调优精度低;另一方面,目前的DBN多数是通过足够的经验和充足的数据确定其结构,且在训练过程中结构将不再调整。在实际过程中,DBN只是通过改变权值参数来适应任务的变化,但如何构造一种DBN使其结构在动态调整的同时不断调整权值参数,是DBN发展的趋势,也是一个开放且尚未解决的问题。研究DBN结构优化设计方法,是为了克服DBN预训练耗时长和调优精度低两个缺陷的同时获得DBN结构动态调整的有效方法。根据设计要求可知,DBN动态结构的训练分为两个阶段且结构在训练过程中实时调整,因此现有的固定结构学习算法难以适应其训练要求。为了解决DBN结构优化设计过程中的问题,本文在深入分析现有DBN研究成果的基础之上,设计了预训练阶段的自适应学习率;建立了基于偏最小二乘回归(Partial Least Square Regression,PLSR)的新型DBN有监督调优模型和稀疏表述方法;研究了包括增量式结构和增长—删减机制在内的一系列结构自调整策略;获得了结构动态调整过程中DBN权值参数的学习算法,并且对结构调整过程中的算法收敛性进行了深入的分析。同时,探索性地将DBN与强化学习(Reinforcement learning,DL)、生成式对抗网络(Generative adversarial network,GAN)以及模型预测控制(Model predictive control,MPC)结合起来,建立了高效的学习和优化控制模型。论文主要工作和创新点如下:(1)无监督学习改进型研究针对DBN无监督特征学习耗时长的问题,设计了自适应学习率算法,旨在提高无监督预训练的学习速度和特征提取效率。由于无监督预训练过程中特征提取与原始数据重构交替进行是一个复杂度较高的计算过程,现有基于固定学习率的对比散度(Contrastive Divergence,CD)参数调整算法削弱了无监督预训练的速度。文中提出一种学习率自适应调整机制,根据CD算法中参数每两次迭代方向的异同来动态降低或增大学习率,不仅能够提高学习速度,还能避开局部最优问题。实验结果证明了以上改进型算法在提高学习速度和特征提取效率方面上的有效性。(2)深度信念网络有监督学习改进型研究针对网络输出鲁棒性能差和传统有监督学习精度低问题,文中提出一种基于PLSR逐层调优的自适应稀疏表述DBN(AS-PLSR-DBN),旨在提高DBN的鲁棒性和调优精度。首先,设计自适应学习率来加速RBM的训练过程,引入两个正则化项来实现稀疏表述(AS-RBM)。其次,以最后一个隐含层提取到的特征为自变量,以输出层的期望输出为因变量,建立PLSR模型,并以同样的方法自上而下每两层建立一个PLSR模型。第三,给出了收敛性分析。最后利用AS-PLSRDBN对Mackey-Glass时间序列预测、二维函数逼近以及复杂系统识别,结果证明了AS-PLSR-DBN具有较高的学习精度和速度,同时具有较强的鲁棒性。(3)自组织深度信念网络尽管DBN已经取得了诸多应用上的成功,但目前其结构大多数是利用人工经验确定且在训练过程不再调整。这种类似超参数赋值的固定结构无法满足数据多样性的任务要求,也无法实现DBN的高效学习。针对DBN的结构设计问题,提出一种基于隐含层神经元激活强度和误差下降率的结构增长—删减设计方法。通过分析隐含层神经元在学习过程中的激活强度,删除激活强度小的神经元,将激活强度大的神经元进行分裂。同时,将网络输出的误差下降率作为隐含层增减的标准,误差下降率如若递增则增加隐含层,误差下降率首次出现递减则减少隐含层。通过对非线性系统建模、污水处理过程出水总磷浓度预测以及大气污染物浓度预测证明了该方法的有效性。(4)基于迁移学习的增量式深度信念网络针对自组织结构中反复权值初始化导致的训练耗时问题,提出一种基于迁移学习策略的结构增量式DBN设计方法。首先,初始化一个结构简单的DBN并对其进行学习预训练,预训练结束后固定学习到的权值参数(知识源域)。其次,在初始化DBN的基础上定量增加神经元和隐含层(目标域),并设计一种有效的迁移学习策略将知识源域中的知识转移到目标域中,从而实现对目标域快速有效的预训练并不断增加结构规模。最后,根据输出性能的误差指标设计一个结构增长的停止准则,结构一旦停止增长将固定不变,并进入有监督训练阶段。利用增量式DBN对CATS缺失时间序列预测和污水处理过程出水总磷浓度预测,结果证明了基于迁移学习的增量式深度信念网络具有较好的结构自调整能力和复杂非线性系统逼近能力。(5)深度强化学习网络通过分析可知,实现知识增殖需要强有力的特征感知方法,而实现关键特征识别则需要快速有效的决策方法。深度学习能够利用其强大的无监督特征提取能力快速的获取数据的先验知识,强化学习则能以试错的机制与环境进行交互,通过最大化累积奖赏的方式来学习到最优决策方法。针对手写数字标准对象MNIST数据库的识别精度低的问题,提出一种将深度学习与Q学习算法相结合的新型判别网络(Q-ADBN)。首先,利用自适应深度自编码器(ADAE)对原始信号进行抽象特征提取,Q学习算法将ADAE对原始信号的编码特征作为当前状态。然后,对当前状态进行分类识别得到一个奖励值,并将奖励值返回给Q学习算法以便进行迭代更新。对MNIST数据库的实验结果证明了Q-ADBN具有快速的学习能力和较高的识别精度。(6)基于能量函数的生成式对抗性深度信念网络生成式对抗网络是目前人工智能领域的一个研究热点,引起了众多学者的关注。针对现有生成式对抗网络生成模型效率低下和判别模型的梯度消失问题,提出一种基于重构误差的能量函数意义下的生成式对抗网络模型(RE-GADBN)。首先,将自适应DBN作为生成模型,来快速学习给定样本数据的概率分布并进一步生成相似的样本数据。其次,将自适应深度自编码器的重构误差作为一个表征判别模型性能的能量函数,能量越小表示生成式对抗网络学习优化过程越趋近纳什均衡的平衡点,否则反之。在MNIST和CIFAR-10两个标准数据集上的实验结果表明,相较于现有的类似模型,RE-GADBN在学习速度和数据生成能力两方面均有较大提高。(7)基于深度信念网络的模型预测控制方法在研究一系列DBN结构优化设计方法的同时,注意到变结构DBN具有较强的复杂系统建模能力。模型预测控制是一种适用于过程控制的滚动优化控制方法,其核心是建立一个能够以较高精度逼近被控对象的预测模型。基于此,探索性的将变结构DBN作为预测模型,研究变结构DBN与控制策略滚动优化的闭环系统动力学特性。首先,将变结构DBN作为被控系统的预测模型,学习并预测被控系统的动力学特性。其次,根据预测模型输出与被控系统参考输出之间的误差以及被控系统控制输入的变化量,建立二次优化模型来求解控制律在每一时刻的最优值。对非线性系统的跟踪控制实验结果初步证明了所提方法的有效性。

孙显卓[8](2019)在《含多微网的主动配电网分层协调电压控制》文中研究说明为应对全球能源危机和日益严峻的环境污染问题,大量的可再生能源(Renewable Energy Source,RES)以分布式电源(Distributed Generation,DG)的形式接入电网,使传统配电网从单源、单向潮流的被动系统变为多源、双向潮流的主动配电网。DG的接入为配电网带来了更多的灵活性和可控性,有效提高了配电网的经济性和可靠性。同时,大规模且形式多样的DG接入会使配电网的运行与控制变得更加复杂,而RES自身的波动性和不确定性会引起电压越限等一系列安全性问题,为电力系统的安全经济运行带来巨大挑战。微电网(Microgrid,MG)作为包含DG、储能单元和用户负荷的独立自治系统,可通过灵活的控制技术提高配电网对RES的接纳能力,已经广泛应用于配电网的运行与控制中。配电网和微电网均为独立自治的系统,拥有各自的运营商和运行控制策略,但由于配电网和微电网物理结构上的关联,两者的控制策略会相互影响。考虑多微网接入下的主动配电网,当配电网下发的指令与各微电网自身目标利益之间存在矛盾时,配微网在公共连接点(Point of Common Coupling,PCC)的传输功率无法达成一致。微电网发出过多或过少的有功和无功功率将对配电网的电压水平产生影响,导致电压越限等安全性问题。在满足电压安全约束的前提下,通过协调控制DG、MG和传统调压设备进一步降低网络损耗、提高经济效益,实现配微网的优化运行。为此,本文针对含多微网的主动配电网,提出了配微网分层协调电压优化控制策略,主要工作和成果如下:(1)考虑多微网接入下的主动配电网,配电网和微电网各自为政,两者在满足电压安全约束的前提下追逐自身利益最大化。建立配微网双层电压优化控制模型,上层为配电网,目标为最小化网损;下层为微电网,目标为最大化经济效益。基于博弈论方法求解配微网双层优化问题,交互PCC点的传输功率并通过多次迭代达到收敛,保证了微电网的自治性和商业机密性,同时实现配电网中传统调压设备和DG的协调优化控制。配电网和微电网的优化问题采用通用数学模型系统(General Algebraic Modeling System,GAMS)软件中的 Dicopt求解器进行求解,算例结果表明双层电压优化控制模型可以解决配电网和微电网中的电压越限问题,同时确保微电网的经济性。(2)为解决配电网调度指令与微电网运行目标之间的矛盾,考虑电价激励,建立配微网协调的双层优化模型。上层配电网的优化目标为最小化调压成本,包括网损成本和购买辅助服务的成本两部分;下层微电网的优化目标为最大化经济收益,包括售电利润和提供辅助服务获得的额外收入。配电网制定电价奖励促使微电网提供辅助服务,微电网权衡自身经济效益与获得的额外调压收益,对配电网的电价奖励做出响应。考虑到配电网无法自适应调节奖励电价而使结果陷入局部最优的问题,提出一种基于电价—无功曲线的改进协调电压优化控制策略。结果表明,改进的控制策略可兼顾配电网和微电网的利益,在保证电压安全的前提下,进一步降低配电网的调压成本并增加微电网的经济收益,达成双赢的局面。(3)为实现微电网电压控制效果与电网通信要求之间的协调,提出一种集中与就地相结合的实时电压控制策略,其本质为对就地电压控制曲线的修正和改进。构建微电网两阶段电压控制框架,通过日前无功计划得到PCC点电压参考值,基于最优潮流算法和曲线拟合方法实现就地电压控制曲线的修正。提出一种P(Ⅴ)与Q(Ⅴ)与相结合的就地电压控制曲线,实现了可控负荷有功、无功的协调控制。采用分段线性拟合方法得到就地电压控制曲线,并与其他曲线拟合方法下的电压控制结果进行了对比。算例结果验证了所提实时电压控制策略的有效性,同时分段线性拟合方法具有更高的拟合度,在解决电压越限和降损方面具有更好的控制效果。

王江萍[9](2019)在《最优策略博弈下短连线交叉口相位差优化控制研究》文中研究指明短连线交叉口由于其间距过短的特性,极易发生排队过长而导致溢出的现象,这种特性,往往使其成为城市路网中的交通瓶颈。交叉口作为路网构成元素与路网运行效率息息相关,为此,我们需要制定相应对策解决因短连线交叉口的存在而加剧甚至造成路网交通拥堵的问题。首先,以解决排队溢出现象为出发点,本文将通过Synchro模拟实验,获取固定服务水平下交叉口不同间距的排队长度,以控制变量法分析间距与排队溢出概率关系,对短连线交叉口控制进行必要性和可行性论证;利用数学建模方法模拟不同交通流下短连线交叉口拥堵情况,总结其交通特性,分析了拥堵车队排队消散时间与信号灯间关系,得到拥堵消散与信号灯间关系。同时为增加信号最优控制目标理论基础,利用元素对比法构造交叉口判断矩阵,以占优博弈方法对最优控制目标进行讨论,获取交叉口最优控制目标;并通过不同状态下交叉口优先控制进行分析,建立交叉口重要度模型,确定协调控制中的交叉口优先等级。其次,根据短连线交叉口特性以及占优博弈论的最优策略分析,建立了延误最小的相位差优化控制模型,该模型对最大排队长度进行约束来防止交叉口排队溢出,通过对比不同放行方式的延误水平,得到了相位差的优化方法。最后以两相位、四相位和新疆乌鲁木齐“老市委”-“西大桥”交叉口作为优化控制对象,验证了本论文提出的相位差优化方法在降低延误、提升运行速度等方面具有更好的特性。论文提出的相位差控制方法对于解决因短连线交叉口存在而引起的路网拥堵和多样化交叉口协调控制具有重要借鉴意义。

赵九花[10](2017)在《复杂网络中的竞争动力学分析与优化》文中进行了进一步梳理对于社会网络中群体观点的形成与演化的研究已经有较长的历史,并逐渐形成一个交叉学科研究方向——观点动力学。人们从不同的角度提出了多种刻画网络中个体观点演化的模型,其中大部分侧重于研究个体间的相互认同,即一致性。然而实际社会网络中不仅广泛存在着协同行为,也存在着各种各样的竞争行为。相比于一致性的研究,对于复杂网络中竞争行为的研究近年来才刚刚起步。本文在综述竞争动力学研究成果的基础上,针对复杂网络中的竞争行为模式构造了连续状态竞争模型,在验证了其合理性的基础上,深入研究了该模型上的竞争行为特点、竞争优化策略以及该模型在不同竞争环境中的扩展。论文的主要工作和研究成果如下:1.提出了一种连续状态竞争动力学模型。该模型中包含两个具有相反状态且保持不变的竞争者,其他常规个体按照经典的一致协议更新自己的状态。模型中常规个体状态会收敛到只与网络结构和网络中竞争者的位置相关的稳态值。该竞争模型能够重现空手道俱乐部网络的真实竞争结果,在一定程度上验证了其合理性。构造了基于网络结构的影响力矩阵,并基于该矩阵给出了判断任一常规个体对竞争者的支持偏好以及预测竞争结果的判据。比较了基于多种节点;中心性指标预测竞争结果的判据。2.研究了异步竞争优化控制问题。重点关注竞争者在已知对方策略的情况下,如何通过添加网络连边改变网络结构,从而提高自身竞争力的问题。首先针对不同的竞争环境给出了关于竞争力的两种定义,并在此基础上构造了两类优化问题。理论证明了优化问题的复杂性,并深入分析了优化目标函数的单调性、亚模性。对几类特殊网络,给出了最优解。对于一般网络,根据优化问题的特性提出了三种优化算法以及多个基于节点中心性的启发式算法,仿真对比了这些算法的有效性。3.研究了同步竞争优化控制问题。重点关注竞争者在对方策略未知的情况下如何添加连边,使自身竞争力最大化的问题。提出了多种基于节点中心性的竞争策略。研究发现,在连续状态竞争模型中,节点中心性指标并没有明显的指示作用,竞争策略的优劣依赖于网络结构和竞争者位置的选取。而在离散状态竞争模型中,节点中心性指标具有明显的指示作用。基于介数中心性的竞争策略优于其他策略,其优势随着网络节点度异质性的增加而增大。4.提出了基本竞争模型的两种扩展:两群竞争者的竞争模型和多个竞争者的竞争模型。对于两群竞争者的情况,即每个群体内部节点状态均相同,群体之间状态对立时,将两个竞争群体视为两个超级竞争者,进而对网络结构进行重构,转化为两个竞争者的模型。修改了影响力矩阵判据和基于节点中心性的判据,使之适用于两群竞争者的情形并验证了其有效性。对于多个互相对立的竞争者情形,为了构造竞争者之间对称且对立的状态,将个体的状态空间从一维增加到二维。证明了个体状态的收敛性,给出了常规个体的稳态值,并明确了个体对竞争者的支持状况和竞争结果。修改了影响力矩阵判据和基于节点中心性的判据。仿真分析了影响各判据有效性的因素。最后,将引入新的竞争者作为一种竞争策略,与添加边的策略进行比较,研究了两种策略所适用的不同情形。

二、博弈论中的一个优化控制模型(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、博弈论中的一个优化控制模型(论文提纲范文)

(1)多智能体博弈强化学习研究综述(论文提纲范文)

1 多智能体深度强化学习关键科学问题
2 多智能体博弈强化学习基本概念
    2.1 马尔可夫决策过程(MDP)
    2.2 随机博弈(Stochastic Games,SG)
    2.3 部分可观察的随机博弈(Partially Observ-able SG,POSG)
    2.4 纳什均衡
    2.5 元博弈(Metagame)
3 标准型博弈
    3.1 共同利益博弈
        3.1.1 团队博弈
        3.1.2 随机势博弈(SPG)
        3.1.3 Dec-POMDP
    3.2 不同利益博弈
        3.2.1 有限零和博弈
        3.2.2 有限一般和博弈
4 扩展式博弈
    4.1 完全信息的扩展式博弈
    4.2 不完全信息的扩展式博弈
        4.2.1 反事实遗憾值最小化算法(CFR)
        4.2.2 虚拟自我对弈算法(NFSP)
5 多智能体博弈强化学习算法的重难点
    5.1 博弈强化学习算法的优化
        5.1.1 收敛性
        5.1.2 求解法则
    5.2 博弈强化学习算法的模型
    5.3 博弈强化学习算法的通用性和扩展性
6 多智能体强化学习算法研究展望
    6.1 基于智能优化算法求解纳什均衡
    6.2 基于元博弈的算法模型
    6.3 基于复因子动力学扩展非对称博弈
7 结论

(2)现代有轨电车车载混合储能系统能量管理策略及容量配置优化研究(论文提纲范文)

致谢
摘要
ABSTRACT
1 绪论
    1.1 研究背景和意义
    1.2 车载储能式有轨电车的国内外研究现状
        1.2.1 车载混合储能系统的容量配置
        1.2.2 车载混合储能系统的能量管理策略
    1.3 论文内容及章节安排
2 能量管理策略与容量配置协同优化
    2.1 储能系统特性及建模
        2.1.1 单体特性及建模
        2.1.2 混合储能系统拓扑选择
    2.2 基于规则的能量管理策略
        2.2.1 基于能量交互的固定功率比例分配策略
        2.2.2 充电策略
    2.3 容量配置协同优化
        2.3.1 边界条件分析
        2.3.2 容量配置优化过程
    2.4 能量管理策略与容量配置协同优化仿真分析
        2.4.1 输入条件
        2.4.2 协同优化过程
        2.4.3 配置结果及性能分析
    2.5 车载混合储能系统配置优化及策略验证的软件开发
        2.5.1 容量配置优化及能量管理策略验证软件
        2.5.2 基于软件仿真的供电方式快速分析
    2.6 本章小结
3 基于多路权模式的有轨电车运行工况构建
    3.1 有轨电车路权分析
        3.1.1 完全独立路权
        3.1.2 半独立路权及信号优先原则
        3.1.3 光谷线有轨电车路权介绍
    3.2 国内外行驶工况研究现状
    3.3 有轨电车行驶工况构建
        3.3.1 有轨电车行驶工况构建方法
        3.3.2 光谷线有轨电车行驶工况构建
    3.4 行驶工况区域性特征分析
    3.5 本章小结
4 基于线路预测的混合储能系统工况自适应优化控制
    4.1 基于状态预测的有轨电车混合储能系统滚动优化策略
        4.1.1 速度预测
        4.1.2 滚动优化
    4.2 工况自适应优化策略
    4.3 工况自适应策略的仿真分析
    4.4 本章小结
5 基于90kW混合储能样机的实验验证
    5.1 90kW电池-超级电容混合储能样机
    5.2 储能变流器控制方案设计
        5.2.1 基于混合储能负载的DC/DC变换器小信号建模
        5.2.2 基于电池负载的DC/DC变换器的控制参数计算
        5.2.3 基于超级电容负载的DC/DC变换器的控制参数计算
    5.3 混合储能系统控制方案验证
        5.3.1 电池控制方案实验验证
        5.3.2 超级电容控制方案实验验证
    5.4 基于规则的能量管理策略实验验证
        5.4.1 固定功率比例分配策略实验验证
        5.4.2 基于能量交互的固定功率比例分配策略实验验证
        5.4.3 充电策略实验验证
    5.5 工况自适应策略的实验验证
    5.6 本章小结
6 结论与展望
    6.1 结论
    6.2 展望
参考文献
作者简历及攻读博士学位期间取得的研究成果
学位论文数据集

(3)基于PSO算法的煤矿通风系统优化与调控(论文提纲范文)

致谢
摘要
abstract
变量注释表
1 绪论
    1.1 概述
    1.2 研究内容和意义
    1.3 煤矿主通风机倒机优化控制研究现状
    1.4 煤矿通风网络优化调节研究现状
    1.5 粒子群算法(PSO)研究现状
    1.6 论文的主要工作及章节安排
2 煤矿通风系统安全经济运行分析与优化调控建模
    2.1 煤矿通风系统安全性、经济性分析
    2.2 煤矿主通风机不停风倒机系统研究
    2.3 煤矿主通风机稳风倒机优化控制建模
    2.4 基于图论的煤矿通风网络描述
    2.5 煤矿通风网络优化调节建模
    2.6 本章小结
3 基于EH~2PSO算法的煤矿主通风机稳风倒机研究
    3.1 煤矿主通风机稳风倒机优化控制算法
    3.2 基于模糊PID控制的煤矿主通风机恒风倒机研究
    3.3 非线性约束规划的煤矿主通风机恒风倒机研究
    3.4 扩展层次异质粒子群算法研究
    3.5 煤矿主通风机稳风倒机EH~2PSO算法
    3.6 仿真与应用研究
    3.7 本章小结
4 煤矿通风网络多目标优化调控算法Corner-SMPSO
    4.1 多目标优化算法综述
    4.2 多目标优化算法性能评价
    4.3 算法的提出
    4.4 角点解搜索
    4.5 Corner-SMPSO算法
    4.6 种群引入角点的SMPSO研究
    4.7 本章小结
5 基于EH~2PSO和 Corner-SMPSO算法混合型多风机复杂煤矿通风网络优化调节
    5.1 煤矿通风网络优化调控目标与方法
    5.2 基于EH~2PSO算法混合型多风机煤矿通风网络节能优化调节
    5.3 煤矿混合型复杂通风网络Corner-SMPSO多目标优化调节研究
    5.4 本章小结
6 结论
参考文献
作者简历
学位论文数据采集

(4)电动汽车驾驶性评价及多目标优化控制研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 课题研究背景与意义
    1.2 驾驶性的研究现状
        1.2.1 燃油车驾驶性研究
        1.2.2 电动汽车驾驶性研究
    1.3 电动汽车驱动策略和换挡策略研究现状
        1.3.1 驱动策略研究现状
        1.3.2 CVT换挡策略研究现状
    1.4 多目标优化研究现状
    1.5 本文的主要研究内容
2 电动汽车驱动策略和换挡策略参数化调整方法
    2.1 纯电动汽车的基本结构及参数
        2.1.1 整车基本结构
        2.1.2 整车基本参数
    2.2 驱动策略的参数化调整方法
        2.2.1 基于转矩负荷系数的驱动策略表示方法
        2.2.2 经济性驱动模式下转矩负荷系数的计算
        2.2.3 动力性驱动模式下转矩负荷系数的计算
        2.2.4 基于负荷因子的驱动模式参数化调整方法
    2.3 换挡策略的参数化调整方法
        2.3.1 CVT最佳经济性换挡策略
        2.3.2 CVT最佳动力性换挡策略
    2.4 本章小结
3 驾驶性、经济性、动力性客观评价方法
    3.1 前言
    3.2 电动汽车驾驶性客观评价方法
    3.3 电动汽车经济性客观评价方法
        3.3.1 经济性客观评价指标
        3.3.2 经济性评价方法
    3.4 电动汽车动力性客观评价方法
        3.4.1 动力性客观评价指标
        3.4.2 动力性评价方法
    3.5 本章小结
4 纯电动汽车整车建模
    4.1 整车建模架构
    4.2 驾驶员模型
    4.3 驱动策略模型
    4.4 驱动电机模型
    4.5 动力电池模型
    4.6 CVT换挡策略模型
    4.7 整车动力学模型
    4.8 驾驶性、经济性、动力性评分模型
    4.9 本章小结
5 多目标优化控制
    5.1 前言
    5.2 多目标优化方法
        5.2.1 多目标优化传统算法
        5.2.2 多目标优化智能算法
        5.2.3 基于Pareto原理的多目标优化算法
    5.3 Pareto多目标优化
        5.3.1 Pareto控制策略研究
        5.3.2 Pareto最优控制曲面
        5.3.3 优化分析
    5.4 本章小结
6 总结与展望
    6.1 全文总结
    6.2 未来工作展望
致谢
参考文献
附录

(5)基于集群划分的主动配电网电压控制与优化调度(论文提纲范文)

致谢
摘要
ABSTRACT
第一章 绪论
    1.1 选题背景与研究意义
    1.2 国内外研究现状
        1.2.1 含分布式电源的配电网过电压控制与调度策略研究现状
        1.2.2 集群及集群划分的发展与研究现状
        1.2.3 基于分布式电源集群划分的配电网电压控制与优化调度研究现状
        1.2.4 考虑不确定性的配电网电压控制与调度研究现状
    1.3 存在问题及研究思路
    1.4 本文工作内容与论文结构
第二章 基于集群划分的配电网实时电压控制
    2.1 引言
    2.2 基于无功/有功电压灵敏度的配电网动态集群划分方法
        2.2.1 配电网无功、有功集群划分解耦
        2.2.2 基于灵敏度函数的配电网动态集群划分指标
        2.2.3 配电网动态集群划分算法
    2.3 基于无功/有功集群划分的配电网实时电压控制策略
        2.3.1 基于关键节点选取的集群内电压控制策略
        2.3.2 基于“先无功后有功”的光伏逆变器控制策略
    2.4 案例仿真
        2.4.1 案例参数说明
        2.4.2 分析场景选择
        2.4.3 基于分布式光伏集群的配单网实时电压控制实现
        2.4.4 案例比较
    2.5 本章小结
第三章 基于集群划分的配电网日前调度与电压实时控制的协调优化
    3.1 引言
    3.2 计及光伏集群划分的配电网日前调度策略
        3.2.1 基于集群划分的配电网运行成本模型
        3.2.2 目标函数与问题求解
    3.3 基于日前调度计划修正的实时电压优化控制策略
    3.4 案例仿真
        3.4.1 案例参数说明
        3.4.2 配电网光伏集群划分结果
        3.4.3 本章策略控制下各设备动作分析
        3.4.4 实时电压优化控制
        3.4.5 多调压单元参与电压调节必要性分析
        3.4.6 计算性能分析
    3.5 本章小结
第四章 计及光伏出力不确定性与集群划分的配电网两层优化调度
    4.1 引言
    4.2 基于集群划分的配电网多利益主体形成方法
    4.3 基于多利益主体的配电网双层优化调度策略
    4.4 利益主体并行优化层调度模型
        4.4.1 PV所有者利益主体调度模型
        4.4.2 电力公司利益主体调度模型
    4.5 利益主体博弈优化层调度模型
    4.6 双层优化求解过程
    4.7 案例仿真
        4.7.1 本章所提方法实现
        4.7.2 集群划分性能分析
        4.7.3 应对不确定性能力分析
        4.7.4 计算性能分析
    4.8 本章小结
第五章 计及源-荷与集群划分多重不确定性的配电网三层优化调度
    5.1 引言
    5.2 计及源-荷与集群划分多重不确定性的配电网三层优化调度策略架构
    5.3 PV所有者利益主体内多重不确定性两阶段鲁棒优化模型
        5.3.1 PV无功利益主体内多重不确定性两阶段鲁棒优化模型
        5.3.2 PV有功利益主体内多重不确定性两阶段鲁棒优化模型
        5.3.3 多重不确定性两阶段鲁棒优化模型求解
    5.4 基于配电网优化重构的电力公司利益主体优化调度
    5.5 计及源-荷与集群划分多重不确定性的配电网三层优化调度策略实现过程
    5.6 案例仿真
        5.6.1 案例参数说明
        5.6.2 案例实现
        5.6.3 案例对比
    5.7 本章小结
第六章 结论与展望
    6.1 研究工作总结
    6.2 未来工作展望
参考文献
攻读博士学位期间的学术活动及成果情况

(6)能源互联网环境下的微电网优化管理控制策略研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
    1.3 研究目的与研究内容
        1.3.1 研究目的
        1.3.2 研究内容
    1.4 研究方法与技术路线
        1.4.1 研究方法
        1.4.2 技术路线
    1.5 本章小结
第二章 微电网与相关控制策略理论基础
    2.1 能源互联网与微电网
    2.2 深度学习与神经网络
    2.3 动态规划原理与自适应动态规划
    2.4 本章小结
第三章 微电网基本框架与分布式供电模型
    3.1 微电网基本框架
    3.2 分布式供电模型
        3.2.1 间歇性分布式电源
        3.2.2 可调度传统发电电源
        3.2.3 存储装置模型
        3.2.4 柔性负荷模型
    3.3 本章小结
第四章 深度学习自适应动态规划下的微电网实时能源管理控制策略
    4.1 微电网实时能源管理控制模型
    4.2 深度学习自适应动态规划实时能源管理控制策略
    4.3 仿真分析
    4.4 本章小结
第五章 微电网实时电价下的能源管理多目标控制策略
    5.1 微电网实时电价能源管理控制模型
    5.2 深度学习自适应动态规划实时电价能源管理控制策略
    5.3 仿真分析
    5.4 本章小结
第六章 有限理性在能源管理控制策略中的应用与仿真案例分析
    6.1 有限理性在微电网实时能源管理控制策略中的应用
    6.2 仿真案例分析
    6.3 本章小结
第七章 研究总结与展望
    7.1 主要研究结论
    7.2 研究的创新点
    7.3 研究展望
致谢
参考文献
附录
图表索引目录

(7)深度信念网络结构优化设计方法与应用(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 课题研究背景及意义
        1.1.1 课题背景
        1.1.2 研究意义
        1.1.3 课题来源
    1.2 深度学习的发展及结构设计研究现状
        1.2.1 人工神经网络的发展
        1.2.2 深度学习的诞生
        1.2.3 深度学习的研究现状
    1.3 深度信念网络的结构设计研究现状
    1.4 论文主要工作
    1.5 论文内容安排
第2章 深度信念网络无监督学习改进型研究
    2.1 引言
    2.2 深度信念网络的标准模型
        2.2.1 拓扑结构
        2.2.2 RBM原理
        2.2.3 无监督预训练过程
        2.2.4 有监督调优过程
    2.3 基于自适应学习率的DBN设计方法
        2.3.1 学习率自适应调整方法
        2.3.2 自适应学习率算法的显着性分析
        2.3.3 仿真研究
    2.4 本章小结
第3章 深度信念网络有监督学习改进型研究
    3.1 引言
    3.2 BP调优算法分析
    3.3 PLSR算法
    3.4 基于自适应稀疏表述和PLSR调优的DBN设计方法
        3.4.1 自适应稀疏表述RBM
        3.4.2 基于PLSR逐层调优算法
        3.4.3 收敛性分析
    3.5 基于自适应稀疏表述和PLSR调优的DBN应用
        3.5.1 Mackey-Glass时间序列预测
        3.5.2 2-D非线性系统逼近
        3.5.3 非线性系统识别
    3.6 本章小结
第4章 自组织深度信念网络
    4.1 引言
    4.2 DBN结构自组织方法
        4.2.1 神经元增减方法
        4.2.2 隐含层增减方法
        4.2.3 自组织算法
        4.2.4 收敛性分析
    4.3 自组织深度信念网络应用
        4.3.1 非线性系统建模
        4.3.2 污水处理过程出水总磷浓度预测
        4.3.3 大气污染物浓度预测
    4.4 本章小结
第5章 基于迁移学习的增量式深度信念网络
    5.1 引言
    5.2 迁移学习
    5.3 增量式深度信念网络设计方法
        5.3.1 结构增长过程
        5.3.2 基于PLSR逐层调优算法
        5.3.3 收敛性分析
    5.4 增量式深度信念网络的应用
        5.4.1 CATS缺失时间序列预测
        5.4.2 污水处理过程出水总磷浓度预测
    5.5 本章小结
第6章 深度强化学习网络
    6.1 引言
    6.2 深度自编码器和Q学习
        6.2.1 深度自编码器
        6.2.2 Q学习算法
    6.3 深度强化学习网络设计方法
    6.4 收敛性分析
        6.4.1 无监督训练阶段
        6.4.2 有监督训练阶段
    6.5 实验及分析
        6.5.1 手写数字图像去噪
        6.5.2 手写数字图像识别
    6.6 本章小结
第7章 基于能量函数的生成式对抗性深度信念网络
    7.1 引言
    7.2 生成式对抗网络
    7.3 生成式对抗性深度信念网络设计方法
        7.3.1 基于能量的模型
        7.3.2 生成式对抗性深度信念网络设计
        7.3.3 收敛性分析
    7.4 基于能量函数的生成式对抗性深度信念网络的应用
        7.4.1 MNIST手写数字识别
        7.4.2 CIFAR-10图像分类
    7.5 本章小结
第8章 基于增量式深度信念网络的模型预测控制
    8.1 引言
    8.2 问题描述
    8.3 模型预测控制
    8.4 深度模型预测控制设计方法
        8.4.1 预测模型
        8.4.2 滚动优化控制
    8.5 收敛性与稳定性分析
        8.5.1 收敛性
        8.5.2 稳定性
    8.6 深度模型预测控制在二阶CSTR系统中的应用
        8.6.1 二阶CSTR系统
        8.6.2 建模与预测
        8.6.3 优化与控制
    8.7 本章小结
结论及展望
参考文献
攻读博士学位期间取得的成果
致谢

(8)含多微网的主动配电网分层协调电压控制(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 课题研究背景和意义
    1.2 含多微网的主动配电网电压控制研究现状
        1.2.1 配电网电压优化控制研究现状
        1.2.2 微电网优化运行控制研究现状
        1.2.3 配电网和多微网协调电压优化控制的研究现状
    1.3 配微网协调电压优化控制存在的问题
    1.4 本文主要工作
第2章 基于博弈论的配微网双层电压优化控制模型
    2.1 分布式电源模型
        2.1.1 光伏发电模型
        2.1.2 微型燃气轮机模型
        2.1.3 电池储能系统模型
    2.2 配微网双层电压优化控制模型
        2.2.1 配电网优化模型
        2.2.2 微电网优化模型
    2.3 基于博弈论方法的双层优化问题求解
        2.3.1 非合作博弈模式下的Nash均衡
        2.3.2 求解步骤
    2.4 算例分析
        2.4.1 系统参数
        2.4.2 结果与分析
    2.5 本章小结
第3章 考虑电价激励的配微网协调电压优化控制策略
    3.1 配微网分层协调电压优化控制
        3.1.1 无功电价市场
        3.1.2 协调控制框架
    3.2 考虑电价激励的双层协调优化模型
        3.2.1 可控负荷模型
        3.2.2 基于机会约束的DG出力不确定性模型
        3.2.3 双层协调优化模型
    3.3 基于电价—功率曲线的改进协调控制策略
        3.3.1 微电网电价功率曲线
        3.3.2 约束的分段线性化
        3.3.3 改进的协调控制策略
    3.4 算例分析
        3.4.1 系统参数
        3.4.2 结果与分析
    3.5 本章小结
第4章 基于改进就地电压功率曲线的微电网实时电压控制策略
    4.1 微电网两阶段实时电压控制框架
    4.2 集中式优化控制模型
    4.3 调压设备的就地电压控制曲线
        4.3.1 P(Ⅴ)与Q(Ⅴ)相结合的电压控制曲线
        4.3.2 就地电压控制曲线生成方法
        4.3.3 曲线拟合方法
    4.4 算例分析
        4.4.1 系统参数
        4.4.2 结果与分析
    4.5 本章小结
第5章 结论与展望
    5.1 结论
    5.2 展望
附录
参考文献
致谢
攻读学位期间发表学术论文和参加科研情况
学位论文评阅及答辩情况表

(9)最优策略博弈下短连线交叉口相位差优化控制研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 国内外研究现状
        1.3.1 国外研究现状
        1.3.2 国内研究现状
        1.3.3 综上小述
    1.4 研究思路
    1.5 研究内容
    1.6 小结
第二章 短连线交叉口判定及拥堵机理
    2.1 短连线交叉口判断
        2.1.1 概率论方法
        2.1.2 Synchro模拟法
        2.1.3 短连线交叉口控制必要性分析
    2.2 短连线交叉口拥堵机理
        2.2.1 城市交通拥堵类型
        2.2.2 短连线交叉口拥堵模拟
    2.3 交通信号灯对短连线交通流的影响
        2.3.1 红灯后的动态
        2.3.2 绿灯后的动态
        2.3.3 x=0 处交通恢复正常
    2.4 小结
第三章 短连线交叉口最优控制策略博弈及重要度分析
    3.1 短连线最优策略博弈
        3.1.1 博弈占优理论
        3.1.2 期望效益最大化
        3.1.3 短连线交叉口最优控制目标
    3.2 短连线交叉口重要度分析
        3.2.1 低饱和状态重要度
        3.2.2 饱和状态重要度
        3.2.3 混合状态重要度
        3.2.4 重要度总结
    3.3 交叉口重要度预测
        3.3.1 聚类与分类预测法
    3.4 交通量离散化处理
    3.5 小结
第四章 短连线交叉口相位差优化控制模型
    4.1 模型假设
    4.2 交叉口控制目标
        4.2.1 外进口道控制
        4.2.2 内进口道控制
    4.3 延误分析
        4.3.1 上行车流(A-B)延误分析
        4.3.2 下行车流(B-A)延误分析
    4.4 相位差确定
        4.4.1 延误水平最小
        4.4.2 相位差确定方法
    4.5 模型算法流程
    4.6 小结
第五章 短连线交叉口协调控制及仿真
    5.1 评价指标选取
        5.1.1 停车次数
        5.1.2 延误时间
        5.1.3 排队长度
    5.2 短连线交叉口协调控制案例
        5.2.1 两相位交叉口
        5.2.2 四相位交叉口
        5.2.3 “老市委”-“西大桥”交叉口
    5.3 小结
第六章 总结与展望
    6.1 研究成果
    6.2 创新点
    6.3 展望
参考文献
附录 实验数据
攻读硕士学位期间取得的研究成果
致谢

(10)复杂网络中的竞争动力学分析与优化(论文提纲范文)

摘要
ABSTRACT
主要符号对照表
第一章 绪论
    1.1 引言
    1.2 复杂网络中的竞争动力学研究进展
        1.2.1 竞争动力学模型
        1.2.2 复杂网络中的竞争优化控制
    1.3 本文的研究内容及结构安排
第二章 基础知识
    2.1 图论的基本概念
    2.2 复杂网络的基本概念
        2.2.1 节点中心性
        2.2.2 网络模型
    2.3 计算复杂性的基本概念
        2.3.1 计算复杂性分类
        2.3.2 证明NPC的一般步骤
第三章 基于一致协议的连续状态竞争动力学模型
    3.1 引言
    3.2 竞争动力学模型
    3.3 竞争模型的合理性验证
    3.4 竞争判据
    3.5 仿真验证及分析
        3.5.1 IM判据有效性验证
        3.5.2 IM判据与其他中心性判据的对比
    3.6 本章小结
第四章 连续状态竞争模型中的异步竞争优化控制
    4.1 引言
    4.2 问题描述
    4.3 理论分析
        4.3.1 优化问题的复杂性
        4.3.2 特殊网络中的优化问题
        4.3.3 优化目标的特殊性质
    4.4 算法设计
        4.4.1 优化算法
        4.4.2 基于节点中心性的启发式算法
    4.5 仿真验证及分析
        4.5.1 三种优化算法的有效性验证
        4.5.2 基于节点中心性的启发式算法的有效性验证
    4.6 本章小结
第五章 两种竞争模型中的同步竞争优化控制
    5.1 引言
    5.2 连续状态竞争模型中的同步竞争优化
        5.2.1 问题描述
        5.2.2 仿真对比及分析
    5.3 离散状态竞争模型中的同步竞争优化
        5.3.1 问题描述
        5.3.2 仿真对比及分析
    5.4 本章小结
第六章 多竞争者连续状态竞争模型
    6.1 引言
    6.2 具有两群竞争者的连续状态竞争模型
        6.2.1 竞争模型与理论分析
        6.2.2 竞争判据
        6.2.3 判据有效性的仿真验证
        6.2.4 与中心性第一判据的对比
    6.3 具有多个竞争者的连续状态竞争模型
        6.3.1 多个竞争者的竞争模型与理论分析
        6.3.2 竞争判据
        6.3.3 判据有效性的仿真验证
        6.3.4 一种新的竞争策略——添加竞争者
    6.4 本章小结
第七章 总结与展望
    7.1 全文总结
    7.2 研究展望
附录A 参数选取
附录B 判断失误分析
参考文献
致谢
攻读学位期间发表的学术论文目录
攻读学位期间参与的项目

四、博弈论中的一个优化控制模型(论文参考文献)

  • [1]多智能体博弈强化学习研究综述[J]. 王军,曹雷,陈希亮,赖俊,章乐贵. 计算机工程与应用, 2021(21)
  • [2]现代有轨电车车载混合储能系统能量管理策略及容量配置优化研究[D]. 王玙. 北京交通大学, 2020(03)
  • [3]基于PSO算法的煤矿通风系统优化与调控[D]. 葛恒清. 中国矿业大学, 2020(01)
  • [4]电动汽车驾驶性评价及多目标优化控制研究[D]. 郑建华. 重庆理工大学, 2020(08)
  • [5]基于集群划分的主动配电网电压控制与优化调度[D]. 肖传亮. 合肥工业大学, 2020(01)
  • [6]能源互联网环境下的微电网优化管理控制策略研究[D]. 吴楠. 贵州大学, 2019(05)
  • [7]深度信念网络结构优化设计方法与应用[D]. 王功明. 北京工业大学, 2019
  • [8]含多微网的主动配电网分层协调电压控制[D]. 孙显卓. 山东大学, 2019(09)
  • [9]最优策略博弈下短连线交叉口相位差优化控制研究[D]. 王江萍. 长安大学, 2019(01)
  • [10]复杂网络中的竞争动力学分析与优化[D]. 赵九花. 上海交通大学, 2017(08)

标签:;  ;  ;  ;  ;  

博弈论中的最优控制模型
下载Doc文档

猜你喜欢