使用区块链实现车联网的安全、隐私保护和可验证的联邦学习引发的思考
吕钦杨 发表于 四川 区块链安全 949浏览 · 2024-06-12 08:32

摘要
车联网(IoV)是实现智能交通系统(ITS)高效交通管理的一种解决方案。数据驱动的ITS需要从车辆数据中学习,并为车辆提供及时的信息,以支持广泛的安全和信息娱乐ITS应用。车联网容易受到多种网络攻击和隐私问题的影响。联邦学习 (FL) 即将通过交换学习模型参数而不是实际数据来提供协作学习,这有望在 IoV 中提供隐私。然而,尽管具有固有的安全和隐私保护框架,但 FL 仍然容易受到中毒和逆向工程攻击。区块链技术 (BC) 已经展示了一种零信任、完全安全、分布式和可审计的信息记录和共享范式。在本文中,我们提出了一个区块链赋能的联邦学习的实践前景,以实现完全安全、隐私保护和可验证的 IoV 和FL,从而能够提供安全可靠的 ITS 服务。

问题
交通拥堵一直是主要问题,随着车辆数量的快速增加,未来将继续上升。世界卫生组织 (WHO) 全球状况报告称,仅在 2018 年就有 135 万人死于道路交通事故。因此,智能交通系统(ITS)中的车联网(IoV)有望为安全导航、检测障碍、优化路线等提供即将到来的交通信息,这对于有效的交通管理和道路安全至关重要。世界各地的政府、公司和学术界都致力于 ITS 的研究、开发和测试。对于ITS而言,车联网是共享和交换信息的支柱,以支持广泛的道路安全和信息娱乐应用。
在车联网中,每辆车都配备了各种智能传感器和基于IEEE 802.11p标准的专用短程通信(DSRC)技术,可以使用车对车(V2V)和车对基础设施(V2I)通信在车辆之间无线共享和交换信息。车辆应定期交换基本安全信息以及其他信息,例如碰撞警告、变道信息、紧急警告、最新交通信息、主动导航、信息娱乐等。蜂窝基础设施和路边单元 (RSU) 放置在道路旁边,以提供道路安全、导航、信息娱乐和其他路边服务。 全球定位系统(GPS)、无线电探测和测距(RADAR)、光探测和测距(LiDAR)、摄像头等车辆中的智能传感器有望捕获大量车辆数据。海量数据有助于开发数据驱动的机器学习 (ML) 和深度学习 (DL) 模型。
这就是车联网的意义所在,但解决问题的同时也会带来问题,车辆接入网络之后,恶意控制车辆可能导致灾难性事故,导致数人死亡和受伤。为了实现高效和有效的ITS,必须建立一个学习系统,该系统不仅提供道路安全和其他与交通相关的服务,而且还能够识别任何类型的异常和入侵并采取纠正措施。应对网络安全问题的传统方法仅在发生特定类型的攻击后才保护设备。
伴随着传统安全的不断升级发展,病毒也在进化,所谓道高一尺魔高一丈,多态病毒的攻击会不断改变其特征,并且难以识别和预测。因此,近年来,检测和预测网络空间中的威胁、异常或任何类型的安全漏洞并采取相应对策的 ML 方法越来越受到关注。为了应对可能的隐私和安全威胁的增加,机器学习范式已经从集中式、分布式学习过渡到联邦学习。联邦学习仅通过交换更新的模型参数(在终端设备和服务器之间)来促进协作学习,而数据保留在终端设备上并且训练在本地执行。

背景
联邦学习 (FL) 简介
FL 是一种分布式模型,其中常规模型或预训练模型最初分发给客户端。使用本地数据,所有客户端都通过在本地执行 ML 任务来个性化其模型,并将其更新的参数发送到 FL 服务器。 然后,服务器聚合从客户端接收的所有更新并执行 ML 任务,最后将更新的全局模型分发到客户端。更新全局模型的过程是迭代的。通过最小化局部目标函数(如随机梯度下降 (SGD))来优化每个客户端的参数。来自客户端设备的优化参数被发送到服务器,客户端接收更新的全局模型。

区块链(BC)简介
区块链的概念自 2008 年以来一直存在,但由于加密货币平台(比特币和以太坊等区块链应用程序)的广泛成功,它最近才成为人们关注的焦点。BC技术基于分布式数字壁架,使用公钥密码学和共识算法作为核心组件,提供无与伦比的安全性、透明度和可追溯性优势。在区块链中,每个区块都保存着在某个时间段内发生的交易的多个记录和一个区块头,其中包含两个重要信息,即前一个区块地址和默克尔根。默克尔树根是BC上所有信息的一种指纹,可用于验证BC所有信息的一致性。即使 BC 上的任何微小信息发生变化,它也会发生变化。Merkle 根基本上是通过组合所有交易的哈希值创建的二叉树根。

工作机制
为了参与拟议的 BC 授权 FL 网络,所有参与者都需要通过当局进行注册程序。然后,当局对参与者进行身份验证并提供必要的 BC 软件。参与者使用私钥和公钥对创建其 BC 身份,以隐藏真实身份作为隐私问题(与在公共 BC 中类似的方式)。CSP 根据他们应该执行的学习任务创建不同的学习模型。然后,它使用参数初始化模型。其中一项学习任务是IDS/IPS,它从网络中学习并保护网络。然后为每个学习任务选择合适的客户。为客户提供相应的模型和参数。在每一轮沟通中,都会选择一部分客户参与使用本地数据训练他们的模型。训练完成后,如果模型参数更新,则需要将参数发送到服务器。为此,客户端对模型参数进行数字签名并将其广播到 BC 网络。然后,BC 网络验证交易。充当验证程序的完整节点使用本地运行的 IDS/IPS 验证参数

IDS/IPS 将检查参数分布与先前参数相比的任何变化。在验证车辆发送的模型参数后,矿工参与区块创建过程。在这个过程中,每个矿工将从参与者那里收到的所有模型参数捆绑到一个区块中,进行联合平均,并尝试找到有效的加密区块地址。联合平均是一个简单的数学过程,它将从参与者那里收到的模型参数相加,然后除以当前参与者的数量。但是,查找有效区块地址所需的计算能力取决于 BC 协议设置的难度级别。矿工竞相寻找区块的有效地址,能够首先找到该地址的人将区块广播到 BC 网络。该区块由网络验证,所有全节点和矿工都通过将其保持在先前的链式区块之上来更新账本。
在提到的 IoV 学习方案中,通常只有当前更新的全局参数才最重要。因此,可能没有必要像公共 BC 中的交易那样将所有交换参数的历史记录保存在分布式账本中,这将有助于节省存储空间。但是,保留先前交易的历史记录可以增强对任何攻击的鲁棒性,并始终保持 BC 一致。此外,在网络节点上运行的 IDS/IPS 在具有要分析的所有历史记录时会智能地学习和运行。因此,为了观察和分析任何恶意活动,最好保留交换的模型参数的历史记录。但是,为了提高存储效率,最好只有维护 IDS/IPS 的节点保留所有带有交易的区块,而其他节点只保留区块头。此外,在 BC 中,可以修剪或从本地存储中删除非关键块历史记录,以减少大小的增长并使 BC 可扩展,
在车联网中,可能会有各种各样的学习任务,例如在不同天气条件下的驾驶、高效的路线、驾驶行为等。属于每个特定学习任务的块按时间顺序存储在创世区块的特定分类账中。这可在 IoV 场景中实现安全、可信、可审计和可验证的 FL 学习。。为了使整个联邦学习系统在计算和存储方面高效,需要以不同的方式处理和管理关键和非关键学习任务。对于非关键学习任务,可能没有必要存储交换参数的历史记录。因此,网络只维护最近交换参数的区块,而只维护过去交易的区块头。为一个学习任务维护一个账本不仅可以提高可管理性,还可以使整个系统在计算和存储方面更加高效。使用这种方法,可以很容易地根据每个学习任务的适用性来分配每个学习任务。例如,没有必要将“如何在雪地里开车”的学习模型分发到沙漠地区。我们分发模型的次数越多,需要的存储和计算就越多,但系统将变得越健壮。根据学习任务的应用和严重性,我们可以通过仔细复制区块与区块头,选择矿工数量与验证者数量以及轻节点,并设置适当的难度级别来控制效率。

BC 为 FL 提供安全和隐私支持
BC使参与者能够以BC身份的形式使用假名来隐藏真实身份。使用假名并通过 BC 网络交换模型参数可消除任何形式的欺骗、伪造和/或逆向工程攻击。此外,联合聚合始终由矿工车辆验证,因此它完全减轻了单点故障,从而减轻了来自服务器端的任何恶意活动的可能性。然而,在客户端,很难防止客户端恶意行为(无论是自身还是通过对抗性控制),但在 BC 节点中运行的 IDS/IPS 能够分析参数的历史记录以识别任何异常并采取纠正措施。

总结
本文介绍了一个完全安全、隐私保护且可验证的 BC 赋能 IoV 和FL 框架。文中总结的方法可缓解 FL 服务器或通信期间可能发生的任何类型的异常。由于传感器和通信标准的脆弱性,在 FL 模型中防止客户端异常始终具有挑战性。然而,仅允许必要的参与者访问 BC 网络可显著减少攻击面。
但这也提出了无限可能,比如
精神、收敛性、准确性、系统异质性、统计异质性、高迁移率等是联邦学习中的常见问题。这些问题已经在物联网环境中进行了探索,但是,由于车联网中的高机动性,物联网解决方案并不直接适用于车联网。这都是需要我们大家思考的。

0 条评论
某人
表情
可输入 255
目录