wordpress样板,seo怎么做新手入门,wordpress登录密码,南昌网站建设是什么意思深度神经网络是一项令人惊叹的技术。 有了足够的标记数据#xff0c;他们可以学习为图像和声音等高维输入生成非常准确的分类器。 近年来#xff0c;机器学习社区已经能够成功解决诸如对象分类、图像中对象检测和图像分割等问题。
上述声明中的加黑字体警告是有足够的标记数…深度神经网络是一项令人惊叹的技术。 有了足够的标记数据他们可以学习为图像和声音等高维输入生成非常准确的分类器。 近年来机器学习社区已经能够成功解决诸如对象分类、图像中对象检测和图像分割等问题。
上述声明中的加黑字体警告是有足够的标记数据。 对真实现象和现实世界的模拟有时会有所帮助。 在某些情况下合成数据可以提高计算机视觉或机器人控制应用中深度学习系统的性能。
模拟可以为我们提供带有免费标签的准确场景。 但我们以侠盗猎车手 V (GTA) 为例。 研究人员利用了在 GTA V 世界中自由漫游时收集的数据集并一直使用该数据集来引导深度学习系统等。 许多游戏设计师和地图制作者都致力于创造 GTA V 的错综复杂的世界。他们一条条街道精心设计然后对街道进行精细梳理添加行人、汽车、物体等。 GTA V侠盗猎车手 V中的示例图像
这很贵。 无论是时间还是金钱。 使用随机模拟场景我们可能不会做得更好。 这意味着重要的编辑情况可能会严重采样不足并且我们的分类器可能无法学习如何正确检测它们。 让我们想象一下我们正在尝试训练一个检测危险场景的分类器。 在现实世界中我们会遇到如下危险场景的频率很低但它们却非常重要。 如果我们生成大量随机场景那么像下面这样的危险场景也很少。 对这些重要情况进行欠采样的数据集可能会产生无法处理这些情况的分类器。
危险交通场景的示例。 当对合成数据进行随机采样时这些重要情况可能会被欠采样。 我们可以做得更好吗
学习模拟Learning to simulate的想法是我们可以学习如何最佳地生成场景以便深度网络可以学习非常好的表示或可以在下游任务中表现良好。 为了测试我们的工作我们使用虚幻引擎 4 和 Carla 插件创建了一个参数化的程序交通场景模拟器。 我们的模拟器创建了一条具有不同类型交叉口X、T 或 L的可变长度道路。 我们可以在道路上布满建筑物并在道路上布满 5 种不同类型的汽车。 建筑物和汽车的数量由可调参数以及汽车的类型控制。 我们还可以在 4 种不同的天气类型之间更改天气从而控制照明和降雨效果。 主要思想是学习控制不同任务例如语义分割或对象检测的这些场景特征的最佳参数。
我们的程序场景模拟器的演示。 我们改变道路的长度、交叉路口、汽车的数量、汽车的类型和房屋的数量。 所有这些都由一组参数控制。
为了获取传感器数据我们将一辆汽车放在生成的场景的道路上它可以从生成的场景中捕获 RGB 图像这些图像自动具有语义分割标签和深度标注免费。
使用一组固定参数从我们的模拟器生成的场景的内部视图
然而学习模拟算法比这更普遍。 我们不必专门将它用于交通场景它可以适用于任何类型的参数化模拟器。 我们的意思是对于任何将参数作为输入的模拟器我们提出了一种搜索最佳参数的方法以便生成的数据对于深度网络学习下游任务来说是最佳的。 据我们所知我们的工作是首先进行模拟优化以最大限度地提高主要任务的性能并将其应用于交通场景。
继续我们算法的关键。 传统的机器学习设置如下其中数据从分布 P(x,y) 中采样x 是数据y 是标签。 通常这是通过收集现实世界中的数据并手动标记样本来实现的。 该数据集是固定的我们用它来训练我们的模型。 传统机器学习
通过使用模拟器训练主任务网络我们可以从模拟器定义的新分布 Q 生成数据。 该数据集不是固定的我们可以在计算和时间限制允许的情况下生成尽可能多的数据。 尽管如此在此域随机化设置中生成的数据是从 Q 中随机采样的。获得良好模型所需的数据可能很大并且性能可能不是最佳的。 我们可以做得更好吗 我们引入学习模拟它优化了我们在主要任务上选择的指标—通过定义与该指标直接相关的奖励函数 R 来训练管道通常与指标本身相同。 我们从参数化模拟器 Q(x,y|θ) 中采样数据用它在算法的每次迭代中训练主要任务模型。 然后我们定义的奖励 R 用于通知控制参数 θ 的策略的更新。 奖励 R 是通过在验证集上测试训练后的网络获得的。 在我们的例子中我们使用普通策略梯度来优化我们的策略。
非正式地我们试图找到最佳参数 θ它为我们提供了分布 Q(x,y|θ)从而最大化主要任务的准确性或任何度量。 学习模拟
学习模拟问题的数学表述是一个双层优化问题。 尝试使用基于梯度的方法解决它会对较低级别的问题造成平滑性和可微性约束。 在这种情况下模拟器也应该是可微分的但这通常是不正确的 这就是为什么像普通策略梯度这样的不需要微分的优化方法是有意义的。 模拟优化问题的双层学习的数学公式
下面展示了我们的实例计数和语义分割方法。
我们探索的汽车计数任务很简单。 我们要求网络计算场景中每种特定类型的汽车数量。 下面是一个示例场景右侧有正确的标签。 汽车计数任务示例
我们使用学习模拟来解决这个问题并与仅使用随机模拟所发生的情况进行比较。 在下图中重点关注红色和灰色曲线它们显示了学习模拟 (LTS) 如何在 250 个 epoch 后获得更高的奖励计算的汽车的平均绝对误差更低。 随机采样情况会短暂改善但一旦采样的随机批次不足以完成任务性能就会下降。 灰色曲线在几次迭代中缓慢上升但学习模拟会收敛到蓝色曲线我们使用真实模拟参数所示的最佳精度。 计车任务奖励。 请注意学习模拟如何收敛到蓝色曲线所示的最佳可能奖励在模拟数据集上。
这意味着什么 观察它的一个好方法是可视化场景中不同场景和对象的概率。 我们绘制随时间变化的天气概率。 我们生成的地面实况验证数据集对某些天气晴朗的中午和晴朗的日落进行了过采样并对其余天气进行了欠采样。 这意味着晴朗的正午和晴朗的日落天气的图像比其他类型的天气更多。 我们可以看到我们的算法恢复了粗略的比例 随时间变化的天气概率 (logits)
让我们对汽车生成概率做同样的事情。 我们的地面实况数据集对某些类型的汽车银色日产和绿色甲壳虫进行了过采样。 学习模拟在训练后也反映了这些比例。 本质上该算法推动模拟器参数来生成与地面实况数据集相似的数据集。 随时间变化的汽车概率logits
现在我们展示一个示例说明学习模拟如何提高 KITTI 流量分段数据集上随机模拟的准确性该数据集是在现实世界中捕获的数据集。 来自 KITTI 数据集的示例图像。 我们的模拟器上的真实语义分割标签的示例。 在模拟器中可以免费获得对象标签 - 无需人工标注者
作为我们的基线我们分别训练主要任务模型 600 次模拟器使用不同的随机参数集生成数据。 我们监控每个网络的验证 Car IoU 指标并选择验证奖励最高的一个。 然后我们在看不见的 KITTI 测试集上对其进行测试。 我们训练学习模拟 600 次迭代并获得 0.579 的 Car IoU广泛分割指标远高于使用随机参数基线随机参数实现的 0.480。 我们还展示了使用另一种无导数优化技术随机搜索的结果该技术在本实验中没有取得良好的结果尽管它在汽车计数方面确实效果很好。 最后我们还通过在 982 个带标注的真实 KITTI 训练图像KITTI 训练集上进行训练来展示用于分割的 ResNet-50 网络的实际性能以显示上限。 学习模拟可以被视为一种元学习算法它调整模拟器的参数以生成合成数据以便基于这些数据训练的机器学习模型分别在验证集和测试集上实现高精度。 我们证明它在实际问题中击败了领域随机化并相信这是一个非常有前途的研究领域。 看到在不久的将来它的扩展和应用会发生什么将是令人兴奋的我鼓励每个人研究模拟和学习模拟如何帮助你的应用或研究。 原文链接学习模拟简明教程 - BimAnt