基于多步回溯Q(λ)学习算法的多目标最优潮流计算余涛#1048577;胡细兵#1048577;刘靖(华南理工大学电力学院,广东广州510640)摘#1048577;要:为了克服传统的最优化算法面对复杂、非线性描述的多目标最优潮流时无法满足电力系统实时调度运行的这一缺点,提出了一种基于半马尔可夫决策过程的多步Q(#1048577;)学习算法,该算法不依赖于对象模型,将最优潮流问题中的约束、动作和目标转换成算法中的状态、动作与奖励,通过不断的试错、回溯、迭代来动态寻找最优的动作.将该算法在多个IEEE标准算例中与其他算法进行比较,取得了良好的效果,验证了多步Q(#1048577;)学习算法在处理多目标最优潮流问题时的可行性和有效性.关键词:电力系统;最优潮流;Q(#1048577;)学习算法;多目
基于多步回溯Q(λ)学习算法的多目标最优潮流计算
下载格式:pdf最后更新:12-20下载积分: 0浏览次数:14
声明:资源收集自网络或用户分享,仅供学习参考,如侵犯您的权益,请联系我们处理。
不能下载?报告错误