拖动时间轴点击获取起止时间码,截取片段时长
不能超过5分钟
×
1889 播放
AI学习泊车 — 深度强化学习
时长:12 分钟
类别:汽车智能技术
简介:这是一个用3D物理模拟AI学习在停车场泊车的视频。模拟是使用Unity的ML-Agents框架实现的。AI由一个深度神经网络组成,包含3个隐藏层,每层128个神经元。它是用近端策略优化(PPO)算法训练的,这是一种强化学习方法。基本上,神经网络的输入是8个深度传感器的读数,汽车当前的速度和位置,以及它与目标的相对位置。神经网络的输出可解释为发动机力、制动力和转向力。