格兰特支持机器学习网络教学研究以做出更好的决策

导读 想象一下一群无人机在勘测一个区域时拍摄照片和视频:什么能让它们尽可能快速、有效地处理收集到的数据?莱斯大学的SantiagoSegarra和Ashuto...

想象一下一群无人机在勘测一个区域时拍摄照片和视频:什么能让它们尽可能快速、有效地处理收集到的数据?莱斯大学的SantiagoSegarra和AshutoshSabharwal获得了陆军研究办公室(美国陆军作战能力发展司令部陆军研究实验室理事会)的拨款,用于开发机器学习框架,以改善军事通信网络的决策过程。该研究还可以帮助为自动驾驶汽车和网络入侵检测等应用提供信息。

“分布式决策在军事网络中至关重要,”该赠款的联合研究员萨巴瓦尔说。

“在高风险、快节奏的环境中,仅仅依赖集中式决策流程可能会导致延迟、瓶颈和漏洞。在整个网络中分散决策和执行职责可以快速响应不断变化的情况并适应不可预见的情况。”

有效的分布式网络控制的主要挑战是组成网络的各个单元(节点)必须找到聚合本地信息并将其提炼为可操作知识的最佳方法。

自由星

在无人机示例中,要执行机器学习任务,例如对实时收集的视觉数据进行对象识别,各个节点(或者在我们的示例中为无人机)必须遵循指定的协议,这些协议指定了信息的处理位置。

Segarra说:“这可以在无人机中完成——其电池和计算能力有限——也可以通过无线连接卸载到总部,但会产生相关的通信延迟。”

最佳决策取决于多种因素,例如数据的大小和敏感性、任务的复杂性以及通信网络的拥塞程度。预先指定如何聚合信息的严格决策协议可能会延迟或阻碍网络的反应能力。Sabharwal和Segarra的目标是开发一种新颖的分布式机器学习架构,使节点能够以最有效的方式组合本地数据。

“我们的目标是让无人机群以分布式方式共同做出最佳卸载决策——也就是说,在没有中央代理告诉每架无人机该做什么的情况下,”塞加拉说。

为了实现这一目标,研究人员将开发一个深度学习框架,其中两个图神经网络在参与者-评论家环境中交互:参与者神经网络做出卸载决策,而评论家评估其质量。通过以迭代方式训练两个神经网络,目标是获得一个多才多艺的参与者,其决策转化为跨广泛场景的快速、自适应行动。