窝牛号

使用ML深度机器学习来预测交通

通过与Google合作,DeepMind能够将AI的好处带给全世界数十亿人。从使语音障碍的用户恢复其原始声音,到帮助用户发现个性化的应用程序,我们可以将突破性的研究应用于Google规模的即时现实问题。今天,我们很高兴分享我们最新合作伙伴关系的成果,为使用Google Maps的十亿多人口带来了真正的全球影响。

DeepMind与Google Maps的合作,依靠Google Maps进行准确的交通预测和预计到达时间(ETA)。这些关键工具非常有用,在需要绕过交通拥堵,需要通知亲朋好友迟到或需要准时离开参加重要会议时特别有用。这些功能对乘车共享公司之类的企业也很有用,这些公司使用Google Maps Platform来提供有关接送时间的信息,并根据行程时间估算价格。 DeepMind的研究人员已与Google Maps团队合作,通过使用先进的机器学习技术(包括Graph Neural Networks)将柏林,雅加达,圣保罗,悉尼,东京和华盛顿特区的实时ETA准确性提高了50%。 ,如下图所示:

Google Maps如何预测预计到达时间 为了计算ETA,Google Maps会分析全球道路段的实时交通数据。尽管这些数据可以使Google Maps准确地了解当前的路况,但它并不能说明驾驶员可能希望在行驶10分钟,20分钟甚至50分钟后看到的路况。为了准确预测未来的路况,Google Maps使用机器学习将世界各地道路的实时路况和历史路况相结合。由于许多原因,此过程很复杂。例如-即使高峰时段不可避免地在每个早晨和晚上发生,高峰时段的确切时间也可能在每天,每月和每月之间有很大差异。道路质量,限速,事故和封闭等其他因素也会增加预测模型的复杂性。 DeepMind与Google Maps合作,帮助提高其全球ETA的准确性。尽管Google Maps的预测性ETA可以准确地完成97%以上的行程,但我们仍与团队合作,将剩余的不准确度进一步降低到了最小,有时甚至在台中等城市也超过了50%。为了在全球范围内做到这一点,我们使用了一种称为图神经网络的通用机器学习体系结构,该体系结构允许我们通过结合关系学习偏差来建模时空道路网络的连通性结构,从而进行时空推理。

将世界道路划分为超级细分市场 DeepMind将道路网络划分为&34;,该路段由多个相邻路段组成,这些路段共享大量交通流量。当前,Google Maps交通预测系统由以下组件组成:(1)路由分析器,其处理数TB的交通信息以构建超级细分市场;(2)一种新颖的Graph神经网络模型,该模型针对多个目标进行了优化并预测了行驶每个超级段的时间。

用于确定最佳路线及其行驶时间的模型架构

在通往交通预测的新型机器学习架构的道路上 使用Supersegments创建机器学习系统来估计旅行时间时要解决的最大挑战是体系结构。DeepMind如何以任意精度表示连接段的动态大小示例,以使单个模型能够成功?

DeepMind最初的概念验证始于简单方法,该方法尽可能地利用了现有的交通系统,特别是现有的路网分割和相关的实时数据管道。这意味着超级路段覆盖了一组路段,其中每个路段都有特定的长度和相应的速度特征。首先,我们为每个超级段训练了一个完全连接的神经网络模型。这些初步结果令人鼓舞,并证明了使用神经网络预测旅行时间的潜力。但是,鉴于超级细分市场的动态规模,我们需要为每个细分市场分别训练一个神经网络模型。

要大规模部署此模型,我们必须训练数百万个这样的模型,这将对基础架构构成巨大挑战。这促使我们研究了可以处理可变长度序列的模型,例如递归神经网络(RNN)。但是,证明很难从公路网中纳入更多的结构。相反,我们决定使用Graph Neural Networks。在对交通进行建模时,我们对汽车如何流经道路网络很感兴趣,而Graph神经网络可以对网络动力学和信息传播进行建模。 我们的模型将本地道路网络视为一个图形,其中每个路线段对应一个节点,并且在同一条道路上连续或通过交叉点连接的段之间存在边缘。在图形神经网络中,执行消息传递算法,其中消息及其对边缘和节点状态的影响由神经网络学习。从这个角度来看,我们的超级路段是道路地图,是根据交通密度随机抽样的。因此,可以使用这些采样子图来训练单个模型,并且可以大规模部署该模型。

图神经网络通过归纳&34;的概念,扩展了卷积神经网络和递归神经网络所施加的学习偏见,使我们能够拥有任意复杂的连接,不仅可以处理我们前方或后方的交通,而且还可以处理相邻和相交的道路。在图神经网络中,相邻节点将消息彼此传递。通过保持这种结构,我们施加了局部偏差,节点将发现更容易依赖相邻节点(这仅需要一个消息传递步骤)。这些机制使Graph神经网络可以更有效地利用道路网络的连通性结构。我们的实验表明,通过扩展到不属于主要道路的相邻道路,可以提高预测能力。例如,想一想小巷的拥堵如何溢出,影响较大道路上的交通。

通过跨越多个交叉路口,该模型可以自然地预测转弯处的延误,归并导致的延误以及走走停停的通行时间。图神经网络在组合空间上进行泛化的这种能力使我们的建模技术具有了强大的功能。但是,每个Supersegment的长度和复杂度都可能有所不同-从简单的两段路由到包含数百个节点的较长路由-都可以由 图神经网络在组合空间上进行泛化的这种能力使我们的建模技术具有了强大的功能。但是,每个Supersegment的长度和复杂度都可能有所不同-从简单的两段路由到包含数百个节点的较长路由-都可以由 图神经网络在组合空间上进行泛化的这种能力使我们的建模技术具有了强大的功能。但是,每个Supersegment的长度和复杂度都可能有所不同-从简单的两段路由到包含数百个节点的较长路由-都可以由相同的图神经网络模型。

从基础研究到生产就绪的机器学习模型 在学术环境中经常被忽视的生产机器学习系统的一大挑战涉及到在同一模型的多次训练过程中可能存在的巨大差异。虽然质量上的细微差异可以作为较差的初始化在更高的学术环境中简单地丢弃,但是这些细微的不一致在数百万个用户中加在一起时会产生很大的影响。

因此,当我们将模型推向生产阶段时,使我们的Graph Neural Network健壮地应对这种变化的培训成为了中心。我们发现图神经网络对训练课程的变化特别敏感-这种不稳定性的主要原因是训练过程中使用的图结构的巨大差异。 然而,经过反复尝试,我们开发了一种方法来解决这一问题,方法是将一种新颖的强化学习技术改编为在有监督的环境中使用。 在训练机器学习系统时,系统的学习率指定了&34;(或可改变为新信息)的程度。

研究人员通常会随着时间的推移降低模型的学习率,因为在学习新事物和忘记已经学到的重要特征之间要进行权衡,这与从童年到成年的发展没有什么不同。我们最初使用了指数衰减的学习速率表,以在预定的训练时间后稳定我们的参数。我们还探索和分析了模型集成技术,这些技术在先前的工作中被证明是有效的,以了解我们是否可以减少训练运行之间的模型差异。 最后,解决此问题的最成功方法是使用MetaGradients在训练过程中动态调整学习率-有效地让系统学习自己的最佳学习率时间表。

通过在训练时自动调整学习率,我们的模型不仅获得了比以前更高的质量,而且还学会了自动降低学习率。这导致了更稳定的结果,使我们能够在生产中使用我们新颖的架构。 通过定制的损失函数使模型通用化 尽管我们建模系统的最终目标是减少差率估算中的误差,但我们发现利用多个损失函数(适当加权)的线性组合可以大大提高模型的泛化能力。具体来说,我们利用模型权重的正则化因子,全局遍历时间的L_2和L_1损失以及图中每个节点的单个Huber和负对数似然(NLL)损失来制定多损失目标。通过组合这些损失,我们能够指导我们的模型,并避免在训练数据集上过度拟合。尽管我们对培训质量的衡量标准没有改变,但培训过程中看到的改进更直接地转化为坚持的测试集和我们的端到端实验。

当前,我们正在研究,将旅行估计误差的减少作为指导指标,MetaGradient技术是否还可以用于在训练过程中改变多分量损失函数的组成。这项工作受到MetaGradient努力的启发,该努力在强化学习中取得了成功,并且早期的实验显示出可喜的结果。 合作 多亏了我们与Google Maps团队的紧密而富有成果的合作,我们得以大规模应用这些新颖的新技术。在一起,我们能够克服研究挑战以及生产和可扩展性问题。最后,最终的模型和技术导致成功发布,从而提高了全球Google Maps和Google Maps Platform API上的ETA的准确性。 在Google范围内开展前沿研究代表着一系列独特的挑战。如果您有兴趣应用诸如Graph Neural Networks之类的前沿技术来解决现实世界中的问题,请在此处了解有关解决这些问题的团队的更多信息。

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除

窝牛号 wwww.93ysy.com   沪ICP备2021036305号-1