当前位置: 首页 > news >正文

做网站开发有什么专业证账户竞价托管公司

做网站开发有什么专业证,账户竞价托管公司,godady怎么做网站,网站建设 考虑一、Qlearning简介 Q-learning是一种强化学习算法,用于解决基于奖励的决策问题。它是一种无模型的学习方法,通过与环境的交互来学习最优策略。Q-learning的核心思想是通过学习一个Q值函数来指导决策,该函数表示在给定状态下采取某个动作所获…

一、Qlearning简介

Q-learning是一种强化学习算法,用于解决基于奖励的决策问题。它是一种无模型的学习方法,通过与环境的交互来学习最优策略。Q-learning的核心思想是通过学习一个Q值函数来指导决策,该函数表示在给定状态下采取某个动作所获得的累积奖励。

Q-learning的训练过程如下:

1. 初始化Q值函数,将所有状态-动作对的Q值初始化为0。

2. 在每个时间步,根据当前状态选择一个动作。可以使用ε-greedy策略来平衡探索和利用。

3. 执行选择的动作,并观察环境返回的奖励和下一个状态。

4. 根据Q值函数的更新规则更新Q值。Q值的更新公式为:Q(s, a) = Q(s, a) + α * (r + γ * max(Q(s', a')) - Q(s, a)),其中α是学习率,γ是折扣因子,r是奖励,s是当前状态,a是选择的动作,s'是下一个状态,a'是在下一个状态下选择的动作。

5. 重复步骤2-4,直到达到停止条件。

Q-learning的优点是可以在没有先验知识的情况下自动学习最优策略,并且可以处理连续状态和动作空间。它在许多领域中都有广泛的应用,如机器人控制、游戏策略和交通路线规划等。

二、TSP问题介绍

旅行商问题(Traveling salesman problem, TSP)是一个经典的组合优化问题,它可以描述为一个商品推销员去若干城市推销商品,要求遍历所有城市后回到出发地,目的是选择一个最短的路线。当城市数目较少时,可以使用穷举法求解。而随着城市数增多,求解空间比较复杂,无法使用穷举法求解,因此需要使用优化算法来解决TSP问题。TSP问题的应用非常广泛,不仅仅适用于旅行商问题本身,还可以用来解决其他许多的NP完全问题,如邮路问题、转配线上的螺母问题和产品的生产安排问题等等。因此,对TSP问题的有效求解具有重要意义。解决TSP问题的方法有很多,其中一种常用的方法是蚁群算法。除了蚁群算法,还有其他一些常用的解决TSP问题的方法,如遗传算法、动态规划和强化学习等。这些方法各有特点,适用于不同规模和特征的TSP问题。

三、Qlearning求解TSP问题

1、部分代码

可以自动生成地图也可导入自定义地图,只需要修改如下代码中chos的值即可。

import matplotlib.pyplot as plt
from Qlearning import Qlearning
#Chos: 1 随机初始化地图; 0 导入固定地图
chos=0
node_num=41 #当选择随机初始化地图时,自动随机生成node_num-1个城市
# 创建对象,初始化节点坐标,计算每两点距离
qlearn = Qlearning(alpha=0.5, gamma=0.01, epsilon=0.5, final_epsilon=0.05,chos=chos,node_num=node_num)
# 训练Q表、打印路线
iter_num=1000#训练次数
Curve,BestRoute,Qtable,Map=qlearn.Train_Qtable(iter_num=iter_num)
#Curve 训练曲线
#BestRoute 最优路径
#Qtable Qlearning求解得到的在最优路径下的Q表
#Map TSP的城市节点坐标## 画图
plt.figure()
plt.ylabel("distance")
plt.xlabel("iter")
plt.plot(Curve, color='red')
plt.title("Q-Learning")
plt.savefig('curve.png')
plt.show()

2、部分结果

(1)以国际通用的TSP实例库TSPLIB中的测试集bayg29为例:

Q-learning得到的最短路线: [1, 28, 6, 12, 9, 3, 29, 26, 5, 21, 2, 20, 10, 4, 15, 18, 14, 22, 17, 11, 19, 25, 7, 23, 27, 8, 24, 16, 13, 1]

(2)随机生成25个城市

Q-learning得到的最短路线: [1, 16, 11, 20, 25, 3, 5, 12, 4, 17, 21, 13, 22, 18, 15, 23, 24, 7, 8, 2, 14, 9, 6, 10, 19, 1]

(3)随机生成35个城市

Q-learning得到的最短路线: [1, 4, 5, 9, 12, 34, 33, 25, 16, 30, 26, 28, 22, 13, 20, 17, 7, 15, 10, 6, 21, 24, 2, 31, 3, 27, 29, 23, 19, 32, 11, 8, 35, 14, 18, 1]

四、完整Python代码

TSP(Python):Qlearning求解旅行商问题TSP(提供Python代码)

文件夹内包含完整Python代码,点击main.py即可运行,可以自定义TSP数据集。

点击main.py即可运行

在main.py中,修改如下值chos

当chos=0时,导入data.txt的城市坐标数据

当chos=1时,随机生成node_num-1个城市坐标

iter_num是最大训练次数

Curve 是训练曲线

BestRoute 是最优路径

Qtable Qlearning是求解得到的在最优路径下的Q表

Map是 TSP的城市节点坐标

http://www.tj-hxxt.cn/news/61739.html

相关文章:

  • 什么值得买 wordpress主题网络优化工程师为什么都说坑人
  • 正版宝安网站推广域名注册网站哪个好
  • 商业网站开发的实训小结怎么写谈谈对seo的理解
  • 企业网站制作开发地推拉新app推广接单平台
  • 国家建设部网站倪虹东莞市网站seo内容优化
  • 遵义做网站建设哪家公司好百度投诉中心入口
  • 做企业网站的多少钱深圳网络营销全网推广
  • 做网站什么系统好风云榜百度
  • 做社交网站多少钱互动营销
  • o2o网站建设多少钱南宁百度seo优化
  • 做网站的怎样找客户橙子建站
  • 网站建设dujujiangxin深圳网络推广营销
  • 哪些企业需要做网站建设武汉做搜索引擎推广的公司
  • .帮别人做网站广州seo网站推广
  • 佛山微信网站设计搜索引擎推广实训
  • 做素材网站如何赚钱山东济南seo整站优化公司
  • 动态网站开发知识点宁波网站制作设计
  • 烟台市建设工程质量检测网站台州关键词优化平台
  • 网站说服力 营销型网站策划 下载互联网公司网站模板
  • 天河网站建设公司万州网站建设
  • 长沙市规划建设局网站搜索引擎排名2021
  • 网站上滚动海报怎么做的seo公司排名教程
  • 怎么做网站引流南昌seo外包公司
  • 万网主机怎么上传网站吗网络营销推广公司
  • 委托别人做网站 域名所有权厦门人才网app
  • 用自己主机做网站山东关键词网络推广
  • 管理学习网站廊坊seo优化排名
  • 英文网站制作 官网新闻源软文发布平台
  • 群晖nas可以做网站佛山网站排名提升
  • 汝州网站制作网络推广的主要内容