谷歌两兄弟Waymo和DeepMind模拟进化论,开发新方法训练AI

  • 时间:
  • 浏览:0

据国外媒体报道,Alphabet旗下的无人驾驶汽车公司Waymo进行了一定量训练来改良驱动其自动驾驶软件的人工智能。最近,它与另一家Alphabet子公司DeepMind商务商务合作开发了两种模拟进化论的新训练法律依据,来提高训练质量和强度。

正如Waymo所解释的那样,人工智能算法通过反复试验来自我改进。另另另一个模型被提出另另另一个任务,它通过不断地尝试和根据它收到的反馈进行调整,来学习执行这俩任务。执行表现在很大程度上依赖于训练方案——被称为超级参数机制——而找到最佳训练方案的任务要有经验的研究人员和工程师亲自去完成。亲戚亲们精心选则正在接受训练的人工智能模型,剔除表现最差的模型,并释放资源从头刚现在开始训练新的算法。

DeepMind设计了两种不沒有劳动密集型的训练法律依据:基于群体的训练(以下简称“PBT”),它从多个由随机变量(超级参数)启动的机器学习模型刚现在开始运作。哪此模型会定期被评估,并以两种进化的法律依据相互竞争,要是 ,表现不佳的群体成员就会被“后代”(表现较好的成员的副本,其中的变量略有变化)所取代。PBT不都也能重新刚现在开始训练,原因分析分析分析每个后代都继承了父网络的情况报告,但会 在整个训练过程中会主动更新超级参数。最终的结果是,PBT有了“良好的”超级参数值,用上多数的资源进行训练。这要是进化的由来,原因分析分析分析这是两种人工自然选则的过程。

PBT何必 完美——它倾向于对当前进行优化,而沒有考虑长期结果,对发展迟缓的人工智能模型不利。为了缓解这俩情况报告,DeepMind的研究人员训练了另另另一个更大的群体,并创建了另另另一个叫做“利基”的亚群体,在这俩群体中,算法只允许在被委托人的子群体中竞争。最后,团队通过为更独特的模型提供竞争优势来直接奖励多样性。

最近,Waymo和DeepMind让PBT接受Waymo创造更好的虚拟司机的挑战,训练结果令人印象深刻——DeepMind在一篇博客文章中表示,借助PBT,负责标识区分由Waymo汽车的诸多传感器发现的行人、骑车者和摩托车骑手的网络误报率下降了24%。不仅沒有,与Waymo事先使用的标准法律依据相比,PBT还节省了离米 60 %的训练时间和资源。

使用这俩法律依据时,为了外理潜在的严重不足,DeepMind经过早期研究事先进行了一点调整,其中包括每隔15分钟就对模型进行评估,构建强大的验证标准和示例集,以便确保测试也能为真实世界构建表现更好的神经网络,而不不是仅适用于它们被灌输的特定数据的良好模式识别引擎。

Waymo表示,它原因分析分析分析将PBT直接纳入了Waymo的技术基础设施中,使得来自整个公司的研究人员只需点击另另另一个按钮就都也能应用PBT。该公司写道,“自哪此实验完成以来,PBT已被应用于一点不同的Waymo车型,并有望帮助创科学科学发明更适合道路行驶的汽车。”