MiX Knowledge

你的车告诉我你开到了哪里：通过 CAN 总线和 OBD-II 数据进行的新颖路径推理攻击

分类： 密码学和安全

作者： Tommaso Bianchi, Alessandro Brighente, Mauro Conti, Andrea Valori

发布时间： 2024-06-30

链接： http://arxiv.org/abs/2407.00585v1

摘要： 尽管存在众所周知的安全问题，控制器局域网（CAN）仍然是车载通信的主要技术。冒充诊断服务或访问 CAN 总线的攻击者可能会威胁驾驶员的位置隐私，从而了解特定时间点的确切位置或推断访问过的区域。这对用户的隐私构成了严重威胁，但也有利于警方调查收集基于位置的证据。在本文中，我们提出了路径诊断 - 入侵和推理（OPD-II），这是一种新颖的路径推理攻击，利用物理汽车模型和地图匹配算法来基于 CAN 总线数据推断汽车行驶的路径。与现有的攻击不同，我们的方法只需要攻击者知道受害者汽车的初始位置和行驶方向，而不受训练数据的可用性、道路配置或访问其他受害者设备（例如智能手机）的需要的限制。我们在不同的道路和交通场景中对四辆不同的汽车和总共 41 条赛道进行攻击。通过利用动态地图匹配算法，我们在重建记录路径的坐标方面实现了平均 95% 的准确度，该算法优于其他提案的 75% 和 89% 准确度值，同时消除了他们的一组假设。

具有经典阴影的量子汽车-Parrinello 分子动力学研究，用于资源高效的分子模拟

分类： 量子物理学

作者： Honomi Kashihara, Yudai Suzuki, Kenji Yasuoka

发布时间： 2024-06-27

链接： http://arxiv.org/abs/2406.18797v1

摘要： 从头算分子动力学 (AIMD) 是模拟分子物理运动以研究材料特性的强大工具。虽然 AIMD 在某些应用中取得了成功，但要执行大规模和长时间的模拟，必须规避其高计算成本。最近几天，近期的量子计算机作为缓解这一挑战的可能解决方案引起了广泛关注。具体来说，黑岩等人。提出了一种称为量子 Car-Parrinello 分子动力学 (QCPMD) 的新 AIMD 方法，该方法利用 Car-Parrinello 方法和 Langevin 公式，使用近期量子器件在平衡态下实现经济有效的模拟。在这项工作中，我们以所提出的 QCPMD 方法为基础，并引入经典阴影技术来进一步提高模拟的资源效率。更准确地说，经典阴影用于同时估计所有原子核的力，这意味着随着分子数量的增加，这种方法更加有效。我们数值研究了我们的方案在 $\text{H}_2$ 分子上的性能，并表明带有经典阴影的 QCPMD 可以模拟平衡状态。我们的结果将为当前可用的量子计算机上的高效 AIMD 模拟提供一些见解。

联网汽车专利组合状况研究

分类： 网络和互联网架构

作者： Abel C. H. Chen, Chia-Shen Chang

发布时间： 2024-06-26

链接： http://arxiv.org/abs/2407.12810v1

摘要： 近年来，世界各国纷纷制定了车联网规范；例如，美国交通部（USDOT）提出了安全凭证管理系统（SCMS），欧盟（EU）提出了合作智能交通系统（C-ITS）凭证管理系统（CCMS）。因此，多家企业基于规范开发了车联网技术和产品，车联网专利组合也已积极开展。因此，本研究利用专利检索系统（PSS）对专利内容进行查找和分析，以根据专利获取车联网的创新报告。本研究考虑单因素和双因素来分析年度、主要技术领导者、主要市场领导者以及主要技术和应用的关系，以探索联网汽车技术领导者和市场领导者的专利组合。

2023年美国车祸原因分析：衡量人们对数据可视化的理解

分类： 人机交互

作者： Hamoud Alhazmi, Marcelo Morales, Jiachen Jiang, Jinxin Zhou, Jian Chen

发布时间： 2024-06-25

链接： http://arxiv.org/abs/2406.17872v1

摘要： 本文以 2023 年美国车祸数据为背景，对交互式数据可视化工具及其功效进行了全面检查。我们开发了交互式热图、直方图和饼图，以增强对事故严重程度随时间和地点分布的理解。我们的研究包括创建和分发在线调查，其中包含九个问题，旨在测试参与者对所提供数据的理解。招募了 15 名受访者来完成调查，目的是评估每个可视化工具的静态和交互式版本的有效性。结果表明，与使用直方图和饼图的参与者相比，使用交互式热图的参与者对数据有更好的理解。相比之下，静态直方图和交互式直方图的用户之间在理解上没有观察到显着差异。出乎意料的是，静态饼图比交互式饼图稍微有效一些。这些发现表明，虽然交互式可视化功能很强大，但其实用性可能会根据所呈现数据的类型和复杂性而有所不同。建议未来的研究探索社会经济因素对车祸数据理解的影响，这可能会导致更加量身定制和有效的可视化策略。这可以更深入地了解车祸的模式和原因，促进利益相关者做出更明智的决策。访问我们的网站，探索我们的互动图，并直接接触数据，以便更全面地了解我们的发现。

研究非共振背景变化对 CARS 数据分析和分类的影响

分类： 光学, 数据分析、统计和概率, 应用领域

作者： Rajendhar Junjuri, Tobias Meyer-Zedler, Jürgen Popp, Thomas Bocklitz

发布时间： 2024-06-25

链接： http://arxiv.org/abs/2406.17829v1

摘要： ：非共振背景 (NRB) 在相干反斯托克斯拉曼散射 (CARS) 光谱应用中发挥着重要作用。最近的所有工作主要集中在使用不同的深度学习方法去除 NRB，只有一项研究探讨了 NRB 的影响。因此，在这项工作中，我们系统地研究了 NRB 变化对拉曼信号检索的影响。 NRB 被模拟为相对于共振拉曼信号具有不同强度的线性函数，并且每个 NRB 强度的方差也发生变化。从真实的实验拉曼数据中提取非线性磁化率的共振部分；因此，模拟的 CARS 数据更好地接近实验 CARS 光谱。然后，通过四种不同的方法检索相应的拉曼信号：最大熵法（MEM）、Kramers-Kronig（KK）、卷积神经网络（CNN）和长短期记忆（LSTM）网络。 Pearson 相关测量和主成分分析与线性判别分析 (PCA-LDA) 模型相结合表明，MEM 和 KK 方法在 NRB 强度方面优于 LSTM 和 CNN。研究还表明，标准化输入数据有利于 LSTM 和 CNN 预测。相反，从预测中去除背景会显着影响 Pearson 相关性，但不会影响 MEM 和 KK 的分类精度。据我们所知，这项综合研究是首次进行，有可能影响不同领域的 CARS 光谱学和显微镜应用。

CAV-AHDV-CAV：通过新型跟车结构和强化学习减轻 CAV 的交通振荡

分类： 机器人技术, 人工智能

作者： Xianda Chen, PakHin Tiu, Yihuai Zhang, Xinhu Zheng, Meixin Zhu

发布时间： 2024-06-23

链接： http://arxiv.org/abs/2407.02517v2

摘要： 联网自动驾驶车辆 (CAV) 为应对 CAV 和人力驾驶车辆 (HDV) 混合交通的挑战提供了一种有前途的解决方案。这种情况下的一个重要障碍是跟车情况下的交通波动或“走走停停”模式。 HDV 依赖的信息有限，而 CAV 可以利用其他 CAV 的数据来做出更好的决策。这使得 CAV 能够预测并减轻导致交通流量恶化的减速波的传播。我们提出了一种新颖的“CAV-AHDV-CAV”跟车框架，该框架将两个 CAV 之间的 HDV 序列视为单个实体，从而消除个体驾驶员行为产生的噪声。这种深度强化学习方法分析车辆平衡状态并采用状态融合策略。我们的模型在包含超过 70,000 个跟车实例的不同数据集（HighD、NGSIM、SPMD、Waymo、Lyft）上进行训练和测试，在防撞方面优于基线，与前车和前车保持平衡，并实现车头时距的最低标准偏差。这些结果证明了我们的方法在为混合交通开发稳健的 CAV 控制策略方面的有效性。我们的模型有潜力减轻交通振荡、提高交通流效率并增强整体安全性。

MetaFollower：适应性强的个性化自动驾驶汽车跟随

分类： 机器学习, 人工智能, 机器人技术

作者： Xianda Chen, Kehua Chen, Meixin Zhu, Hao, Yang, Shaojie Shen, Xuesong Wang, Yinhai Wang

发布时间： 2024-06-23

链接： http://arxiv.org/abs/2406.16978v1

摘要： 跟驰（CF）建模是微观交通模拟的基本组成部分，在过去的几十年里引起了研究人员越来越多的兴趣。在这项研究中，我们利用元学习的力量提出了一种适应性强的个性化跟车框架-MetaFollower。具体来说，我们首先利用与模型无关的元学习（MAML）从各种 CF 事件中提取常见的驾驶知识。之后，预训练的模型可以在新驾驶员上仅用少量的CF轨迹进行微调，以实现个性化的CF适应。我们还结合了长短期记忆（LSTM）和智能驱动模型（IDM）来反映具有高可解释性的时间异质性。与传统的自适应巡航控制 (ACC) 系统依赖预定义设置和恒定参数而不考虑异构驾驶特征不同，MetaFollower 可以准确捕获和模拟跟车行为的复杂动态，同时考虑各个驾驶员的独特驾驶风格。我们通过展示 MetaFollower 快速适应有限训练数据的新驾驶员的能力，展示了 MetaFollower 的多功能性和适应性。为了评估 MetaFollower 的性能，我们进行了严格的实验，将其与数据驱动和基于物理的模型进行比较。结果表明，我们提出的框架在预测跟车行为方面优于基线模型，具有更高的准确性和安全性。据我们所知，这是第一个基于元学习的汽车跟随模型，旨在通过考虑驾驶员和时间异质性来实现快速适应。

EditFollower：可定制自适应巡航控制系统的可调汽车跟随模型

分类： 机器人技术, 人工智能

作者： Xianda Chen, Xu Han, Meixin Zhu, Xiaowen Chu, PakHin Tiu, Xinhu Zheng, Yinhai Wang

发布时间： 2024-06-23

链接： http://arxiv.org/abs/2407.02516v1

摘要： 在驾驶技术领域，全自动驾驶汽车尚未得到广泛采用，因此高级驾驶辅助系统（ADAS）对于增强驾驶体验至关重要。自适应巡航控制 (ACC) 已成为 ADAS 的关键组成部分。然而，当前的 ACC 系统通常采用固定设置，无法直观地捕捉驾驶员的社交偏好，并导致潜在的功能脱离。为了克服这些限制，我们提出了可编辑行为生成（EBG）模型，这是一种数据驱动的跟车模型，可以调整驾驶失礼水平。该框架将多种礼貌计算方法集成到长短期记忆 (LSTM) 和 Transformer 架构中，提供了捕获细微驾驶动态的综合方法。通过在训练过程中整合各种不礼貌的价值观，我们的模型生成了跟车行为中具有不同礼貌程度的真实代理轨迹。 HighD 和 Waymo 数据集的实验结果表明，与基线相比，间距均方误差 (MSE) 和速度 MSE 有所降低，从而建立了风格可控性。据我们所知，这项工作代表了第一个能够动态调整不礼貌水平的数据驱动的跟车模型。我们的模型为 ACC 系统的开发提供了宝贵的见解，该系统考虑了驾驶员的社交偏好。

自动驾驶异步大语言模型增强规划器

分类： 机器人技术, 计算机视觉和模式识别

作者： Yuan Chen, Zi-han Ding, Ziqin Wang, Yan Wang, Lijun Zhang, Si Liu

发布时间： 2024-06-20

链接： http://arxiv.org/abs/2406.14556v1

摘要： 尽管实时规划器在自动驾驶方面表现出了卓越的性能，但对大型语言模型（LLM）的不断探索为增强运动规划的可解释性和可控性开辟了途径。然而，基于大语言模型的规划者仍然面临重大挑战，包括资源消耗增加和推理时间延长，这对实际部署构成了巨大障碍。鉴于这些挑战，我们引入了AsyncDriver，这是一种新的异步LLM增强型闭环框架，旨在利用LLM产生的场景相关指令特征来指导实时规划器进行精确且可控的轨迹预测。一方面，我们的方法突出了大语言模型在理解和推理矢量化场景数据和一系列路由指令方面的能力，展示了其对实时规划者的有效帮助。另一方面，所提出的框架将大语言模型和实时规划器的推理过程解耦。通过利用推理频率的异步特性，我们的方法成功降低了 LLM 引入的计算成本，同时保持了可比较的性能。实验表明，我们的方法在 nuPlan 的挑战性场景中实现了卓越的闭环评估性能。

辐射灾难场景半自主移动搜救机器人

分类： 机器人技术

作者： Simon Schwaiger, Lucas Muster, Georg Novotny, Michael Schebek, Wilfried Wöber, Stefan Thalhammer, Christoph Böhm

发布时间： 2024-06-20

链接： http://arxiv.org/abs/2406.14385v1

摘要： 本文描述了一种新型半自主移动机器人系统，旨在协助灾难场景中的搜救（SAR）急救人员。虽然机器人在搜寻与援救任务中具有巨大潜力，但当前的解决方案处理各种任务的能力有限。通过提出一种能够解决这一差距的系统，该系统能够：(1) 自主导航和测绘，使机器人能够自主探索和绘制受灾难事件影响的区域；(2) 辐射测绘，使系统能够根据离散辐射测量对辐射图进行三角测量帮助识别危险区域，(3) 半自主物质采样，允许机器人收集可疑物质样本并在船上进行分析并立即分类，以及 (4) 阀门操作，实现远程操作关闭控制危险物质流动的阀门。这种半自主方法平衡了人类对物质采样等关键任务的控制与低风险区域的高效机器人导航。该系统在模拟可能的灾难场景的三项试验中进行了评估，其中两次是在欧洲机器人黑客马拉松（EnRicH）期间记录的。此外，我们通过 GitHub 存储库提供记录的传感器数据以及实施的软件系统作为补充材料：https://github.com/TW-Robotics/search-and-rescue-robot-IROS2024。

用于小鼠颅窗创建的自主机器人钻孔系统

分类： 机器人技术, 人工智能

作者： Enduo Zhao, Murilo M. Marinho, Kanako Harada

发布时间： 2024-06-20

链接： http://arxiv.org/abs/2406.14135v1

摘要： 无论科学家的技能如何，生命科学中实验操作的机器人辅助预计都会带来有利的结果。生命科学中的实验样本容易受到个体差异的影响，因此需要复杂的算法来成功实现自主机器人控制。作为一个用例，我们正在研究小鼠颅窗的创建。该手术需要去除头骨的8毫米圆形斑块，其厚度约为300微米，但小鼠头骨的形状和厚度根据小鼠的品系、性别和年龄而显着变化。在这项工作中，我们提出了一种无需离线规划的自主机器人钻孔方法，由具有执行时间反馈的轨迹规划块组成，并具有基于图像和力信息的完成水平识别。力信息使完成级分辨率提高 10 倍。我们以两种方式评估所提出的方法。首先，在蛋壳钻孔任务中，20次试验中成功率达到95%，平均钻孔时间为7.1分钟。其次，在死后小鼠身上进行的 20 次试验中，成功率为 70%，平均钻孔时间为 9.3 分钟。

GTP-UDrive：混合交通环境下自动驾驶的统一博弈论轨迹规划器和决策器

分类： 机器人技术

作者： Nouhed Naidja, Guillaume Sandou, Stéphane Font, Marc Revilloud

发布时间： 2024-06-20

链接： http://arxiv.org/abs/2406.14077v1

摘要： 了解自动驾驶汽车和人类操作车辆之间的相互依赖性仍然是一个持续的挑战，对自动驾驶的安全性和可行性具有重大影响。这种相互依赖性源于道路使用者之间固有的相互作用。因此，自动驾驶汽车（AV）了解这一点至关重要为此，本文提出了GTP-UDRIVE，一种考虑混合交通环境的统一博弈论轨迹规划器和决策者。我们的模型在决策过程中考虑了其他车辆的意图，并基于回旋插值技术为 AV 提供了类似人类的轨迹。% 这项研究研究了一种基于粒子群优化 (PSO) 的求解器，该求解器可以快速收敛到最佳决策。在高度交互的交通场景中，交叉路口尤其具有挑战性。因此，我们选择在无信号交叉口使用实验性自动驾驶车辆来证明我们的方法在实际交通条件下的可行性和有效性。测试结果表明，我们的方法适用于 1）同时做出决策和生成轨迹。 2）将车辆的轨迹描述为分段回旋曲线并强制执行几何约束。 3) 降低轨迹优化问题的搜索空间维数。

自动驾驶汽车的熵正则化决策 GPT 模型

分类： 机器人技术

作者： Jiaqi Liu, Shiyu Fang, Xuekai Liu, Lulu Guo, Peng Hang, Jian Sun

发布时间： 2024-06-20

链接： http://arxiv.org/abs/2406.13908v1

摘要： 在自动驾驶汽车（AV）领域，决策是显着影响自主导航效率的关键因素。随着该领域的发展，复杂环境中决策能力的增强已成为数据驱动方法论研究的中心领域。尽管取得了显着的进步，自动驾驶汽车现有的基于学习的决策策略仍然存在进一步完善的机会，特别是在政策的阐明和安全保证方面。在本研究中，与自动驾驶车辆相关的决策挑战通过约束马尔可夫决策过程（CMDP）框架进行概念化，并作为序列建模问题来处理。利用生成式预训练变压器（GPT），我们引入了一种专为自动驾驶汽车量身定制的新型决策模型，该模型结合了熵正则化技术来支持探索并提高安全性能。在各种场景中进行的综合实验证实，我们的方法超越了几种既定的基线方法，特别是在安全性和整体功效方面。

自动驾驶汽车的自我需求——将稳态应用于自动驾驶的理论模型

分类： 人机交互, 机器人技术

作者： Martin Schmalzried

发布时间： 2024-06-19

链接： http://arxiv.org/abs/2407.12795v2

摘要： 本文探讨了通过旨在增强自动驾驶汽车自主性、安全性和效率的稳态架构为自动驾驶汽车创建“自我”的概念。所提出的系统集成了向内聚焦的传感器来监测汽车的内部状态，例如金属车身、车轮、发动机和电池的状况，建立代表最佳功能的基线稳态。然后，通过量化动态平衡的偏差，来解释外向传感器（例如摄像头和激光雷达）对汽车动态平衡状态的影响。这与试图让汽车以与人类类似的方式“看到”现实并以与人类相同的方式识别现实中的元素的方法形成鲜明对比。将利用虚拟环境来加速培训。此外，汽车被编程为通过区块链技术进行交流和分享经验，从彼此的错误中学习，同时保持个性化的训练模型。提出了一种自动驾驶汽车专用语言，以实现对环境数据的细致解释和响应。这种架构允许自动驾驶汽车根据内部和外部反馈动态调整其行为，促进合作和持续改进。该研究最后讨论了人工智能发展的更广泛影响、潜在的现实应用和未来的研究方向。

自动驾驶的安全非保守轨迹规划处理交通参与者的意外行为

分类： 系统与控制, 系统与控制

作者： Tommaso Benciolini, Michael Fink, Nehir Güzelkaya, Dirk Wollherr, Marion Leibold

发布时间： 2024-06-19

链接： http://arxiv.org/abs/2406.13396v1

摘要： 自动驾驶的轨迹规划具有挑战性，因为必须考虑交通参与者未来未知的运动，从而产生很大的不确定性。基于随机模型预测控制 (SMPC) 的规划器提供非保守规划，但不排除（小）碰撞概率。我们提出了一种控制方案，在交通场景允许的情况下，可以基于 SMPC 产生有效的轨迹，同时仍然避免车辆与交通参与者发生碰撞（如果后者根据预测假设移动）。如果某些交通参与者的行为不符合预期，则无法提供安全保证。然后，我们的方法使用约束违反概率最小化技术生成一条将碰撞概率最小化的轨迹。我们的算法还可以进行调整，以尽量减少碰撞造成的预期伤害。我们全面讨论了我们的新型控制方案的优点，并通过 CommonRoad 数据库的数值模拟将其与以前的方法进行了比较。

CoAct：自主代理协作的全球本地层次结构

分类： 计算和语言

作者： Xinming Hou, Mingming Yang, Wenxiang Jiao, Xing Wang, Zhaopeng Tu, Wayne Xin Zhao

发布时间： 2024-06-19

链接： http://arxiv.org/abs/2406.13381v1

摘要： 现有的大语言模型在各种 NLP 任务上表现出了出色的表现，但即使配备了 CoT 和 ReAct 等先进策略，仍然难以应对复杂的现实世界任务。在这项工作中，我们提出了CoAct框架，它将人类社会中的分层规划和协作模式转移到LLM系统中。具体来说，我们的CoAct框架涉及两个代理：（1）全局规划代理，用于理解问题范围，制定宏观计划并向本地执行代理提供详细的子任务描述，作为全局计划的初始再现。 (2)本地执行代理，在多层任务执行结构内运行，重点关注全局计划内具体任务的详细执行和实施。 WebArena 基准测试的实验结果表明，CoAct 可以在面临故障时重新安排流程轨迹，并在长范围 Web 任务上实现优于基线方法的性能。代码可在 https://github.com/xmhou2002/CoAct 获取。

以简单取胜：为方程式学生设计的自动驾驶汽车

分类： 机器人技术

作者： Tobias Friedrich, Marco Müller, Adrian Bauske, Simon Härtl, Johannes Herrmann, David Förster, Tobias Tietze, Sebastian Sartor

发布时间： 2024-06-19

链接： http://arxiv.org/abs/2406.13256v1

摘要： 本文介绍了拜罗伊特大学 Elefant Racing 团队自行设计、自行开发、自行建造的自动驾驶赛车的设计。该系统是为了参加学生方程式无人驾驶竞赛而创建的。其主要焦点是加速赛道（一条 75 米长的直线赛道）和滑板赛道（由两个圆圈组成的八字形赛道）。此外，它在实验上能够参加 Autocross 和 Trackdrive 赛事，这些赛事的赛道具有以前未知的直线和曲线。该论文详细介绍了 2020/2021 赛季使用的硬件、软件和传感器设置。尽管是由一个计算机科学专业知识有限的小团队开发的，但该设计还是赢得了 Formula Student East 工程设计奖。该团队强调简单性和效率，采用简化的技术来取得成功。

通过时机更好地行动：自动驾驶的时机感知强化学习

分类： 机器人技术

作者： Guanzhou Li, Jianping Wu, Yujing He

发布时间： 2024-06-19

链接： http://arxiv.org/abs/2406.13223v1

摘要： 应对密集交互场景是自动驾驶发展的重大挑战之一。强化学习（RL）通过与环境交互的自我进化机制为此类场景提供了理想的解决方案。然而，普通强化学习中缺乏足够的安全机制，导致智能体常常难以在高度动态的环境中良好地交互，并且可能会在追求短期奖励时发生冲突。许多现有的安全强化学习方法需要环境建模来生成约束智能体行为的可靠安全边界。然而，在动态环境中获取这样的安全边界并不总是可行的。受不确定性最小时驾驶员行动行为的启发，本研究引入了行动时机的概念来取代显式安全边界模型。我们将“演员”定义为在每一步决定最佳行动的代理。通过将行动者利用机会行动想象成一个依赖于时间的渐进过程，另一个称为“时间接受者”的智能体可以评估最佳动作执行时间，并将最佳时机与每个行动时刻相关联，作为动态安全因素来约束行动者的行动。行动。在涉及复杂、无信号交叉口交互的实验中，与所有基准模型相比，该框架实现了卓越的安全性能。

LLMatDesign：使用大型语言模型进行自主材料发现

分类： 材料科学, 人工智能, 计算和语言

作者： Shuyi Jia, Chao Zhang, Victor Fung

发布时间： 2024-06-19

链接： http://arxiv.org/abs/2406.13163v1

摘要： 发现新材料可能具有重大的科学和技术意义，但由于化学空间的巨大，目前仍然是一个具有挑战性的问题。机器学习的最新进展使得数据驱动的方法能够快速筛选或生成有前途的材料，但这些方法仍然严重依赖于大量的训练数据，并且通常缺乏材料发现中所需的灵活性和化学理解。我们推出了 LLMatDesign，这是一种基于语言的新型框架，用于由大语言模型 (LLM) 提供支持的可解释材料设计。 LLMatDesign 利用 LLM 代理来翻译人类指令、对材料进行修改并使用提供的工具评估结果。通过对之前的决策进行自我反思，LLMatDesign 以零机会的方式快速适应新的任务和条件。对 LLMatDesign 对多项材料设计任务进行的系统评估，通过计算机模拟验证了 LLMatDesign 在小数据范围内开发具有用户定义的目标属性的新材料的有效性。我们的框架展示了大语言模型引导的自主材料发现在计算环境和未来自动驾驶实验室中的巨大潜力。

Crossfusor：用于汽车跟随轨迹预测的交叉注意力变压器增强条件扩散模型

分类： 机器学习, 人工智能, 机器人技术

作者： Junwei You, Haotian Shi, Keshu Wu, Keke Long, Sicheng Fu, Sikai Chen, Bin Ran

发布时间： 2024-06-17

链接： http://arxiv.org/abs/2406.11941v1

摘要： 车辆轨迹预测对于推进自动驾驶和高级驾驶员辅助系统 (ADAS)、提高道路安全和交通效率至关重要。虽然传统方法已经奠定了基础工作，但现代深度学习技术，特别是基于变压器的模型和生成方法，通过捕获车辆运动和交通交互中的复杂和非线性模式，显着提高了预测精度。然而，这些模型往往忽略了现实世界驾驶场景中必不可少的详细跟车行为和车辆间交互。本研究引入了专为跟车轨迹预测而设计的交叉注意力变压器增强条件扩散模型（Crossfusor）。 Crossfusor 将详细的车辆间交互和汽车跟随动力学集成到强大的扩散框架中，提高了预测轨迹的准确性和真实性。该模型利用新颖的时间特征编码框架，结合 GRU、基于位置的注意力机制和傅立叶嵌入来捕获历史车辆动态。它在前向扩散过程中采用由这些编码的历史特征缩放的噪声，并在反向去噪过程中使用交叉注意力变换器来建模复杂的车辆间依赖性。 NGSIM 数据集上的实验结果表明，Crossfusor 的性能优于最先进的模型，特别是在长期预测方面，展示了其增强自动驾驶系统预测能力的潜力。

DrivAerNet++：具有计算流体动力学模拟和深度学习基准的大规模多模式汽车数据集

分类： 机器学习, 人工智能, 计算工程、金融和科学, 流体动力学

作者： Mohamed Elrefaie, Florin Morar, Angela Dai, Faez Ahmed

发布时间： 2024-06-13

链接： http://arxiv.org/abs/2406.09624v1

摘要： 我们推出 DrivAerNet++，这是最大、最全面的空气动力学汽车设计多模态数据集。 DrivAerNet++ 包含 8,000 种不同的汽车设计，通过高保真计算流体动力学 (CFD) 模拟进行建模。该数据集包括不同的汽车配置，例如快背车、凹背车和旅行车，具有不同的车身底部和车轮设计来代表内燃机和电动汽车。数据集中的每个条目都包含详细的 3D 网格、参数化模型、空气动力学系数以及广泛的流动和表面场数据，以及用于汽车分类和点云数据的分段部分。该数据集支持广泛的机器学习应用，包括数据驱动的设计优化、生成建模、代理模型训练、CFD 仿真加速和几何分类。 DrivAerNet++ 拥有超过 39 TB 的公开可用工程数据，填补了可用资源的重大空白，提供高质量、多样化的数据来增强模型训练、促进泛化并加速汽车设计流程。除了严格的数据集验证之外，我们还提供了空气动力阻力预测任务的机器学习基准测试结果，展示了我们的数据集支持的应用程序的广度。该数据集将通过促进创新和提高空气动力学评估的保真度，对汽车设计和更广泛的工程学科产生重大影响。

UruBots 自动驾驶汽车第一队 FIRA 2024 描述文件

分类： 机器人技术

作者： Pablo Moraes, Christopher Peters, Any Da Rosa, Vinicio Melgar, Franco Nuñez, Maximo Retamar, William Moraes, Victoria Saravia, Hiago Sodre, Sebastian Barcelona, Anthony Scirgalea, Juan Deniz, Bruna Guterres, André Kelbouscas, Ricardo Grando

发布时间： 2024-06-13

链接： http://arxiv.org/abs/2406.08745v1

摘要： 本文档介绍了 UruBots 团队为 2024 年 FIRA 自动驾驶汽车竞赛挑战赛开发的自动驾驶汽车的设计。该项目涉及制造一款遥控汽车大小的电动汽车，能够自动在赛道上行驶。它将机械和电子系统与基于人工智能的算法集成在一起，用于导航和实时决策。我们项目的核心包括利用基于人工智能的算法从摄像头学习信息并在机器人中执行导航。我们证明，通过创建一个包含 5000 多个样本的数据集和一个五层 CNN，我们成功地实现了我们建议的硬件设置的良好性能。总的来说，本文旨在展示我们汽车的自动驾驶能力，强调其为应对 2024 年 FIRA 挑战做好了准备，有助于为自动驾驶汽车研究领域做出贡献。

UruBots 自动驾驶汽车第二队：FIRA 2024 团队描述文件

分类： 机器人技术

作者： William Moraes, Juan Deniz, Pablo Moraes, Christopher Peters, Vincent Sandin, Gabriel da Silva, Franco Nunez, Maximo Retamar, Victoria Saravia, Hiago Sodre, Sebastian Barcelona, Anthony Scirgalea, Bruna Guterres, Andre Kelbouscas, Ricardo Grando

发布时间： 2024-06-13

链接： http://arxiv.org/abs/2406.08741v1

摘要： 本文提出了一款迷你自动驾驶汽车，由 UruBots 团队用于 2024 年 FIRA 自动驾驶汽车竞赛挑战赛。该车辆的设计重点是低成本和轻量化。我们的车辆由 Raspberry PI4 提供动力，总重量为 1.15 公斤，我们的车辆能够在 11 秒内以最佳评估的速度跑完约 13 米的赛道，平均速度为 1.2m/s。平均的。该性能是在使用 1500 个样本训练总共 60 个周期的卷积神经网络后实现的。总的来说，我们相信我们的车辆适合在 2024 年 FIRA 自动驾驶汽车竞赛挑战赛中表现，有助于研究领域和竞赛类别的发展。

两辆相同的杜宾斯汽车之间的游戏：在最短时间内躲避圆锥形传感器

分类： 机器人技术, 优化与控制

作者： Ubaldo Ruiz

发布时间： 2024-06-12

链接： http://arxiv.org/abs/2406.08637v1

摘要： 移动机器人技术的一项基本任务是当智能代理在环境中移动时，由自主机器人对其进行监视。这项工作研究了该问题的一个版本，涉及机器人技术中最流行的车辆平台之一。特别是，我们考虑两辆相同的杜宾汽车在没有障碍物的平面上移动。其中一个充当追踪者，它配备了一个有限视场检测区域，该区域被建模为半无限圆锥体，其顶点位于追踪者的位置。追赶者的目标是让另一辆杜宾斯汽车（扮演逃避者）尽可能多地停留在其检测区域内。相反，逃避者却想尽快逃脱。在这项工作中，我们采用微分博弈论，在游戏结束时找到了时间最优的运动策略。对这些轨迹的分析揭示了至少两个奇异表面的存在：过渡表面和逃避者的通用表面。我们还发现，屏障的标准结构产生的表面部分位于游戏空间之外，并且无法定义封闭区域，这意味着需要额外的程序来确定逃避者逃脱的所有配置。

3DRealCar：具有 360 度视图的野外 RGB-D 汽车数据集

分类： 计算机视觉和模式识别

作者： Xiaobiao Du, Haiyang Sun, Shuyun Wang, Zhuojie Wu, Hongwei Sheng, Jiaying Ying, Ming Lu, Tianqing Zhu, Kun Zhan, Xin Yu

发布时间： 2024-06-07

链接： http://arxiv.org/abs/2406.04875v1

摘要： 3D 汽车通常用于自动驾驶系统、虚拟/增强现实和游戏。然而，现有的 3D 汽车数据集要么是合成的，要么是低质量的，与高质量的真实 3D 汽车数据集存在很大差距，并限制了它们在实际场景中的应用。在本文中，我们提出了第一个大规模 3D 实车数据集，称为 3DRealCar，提供三个独特的特征。 (1) \textbf{High-Volume}：通过 3D 扫描仪对 2,500 辆汽车进行细致扫描，获得具有真实尺寸的汽车图像和点云； (2) \textbf{高质量}：每辆车平均捕获 200 个密集、高分辨率的 360 度 RGB-D 视图，从而实现高保真 3D 重建； (3) \textbf{High-Diversity}：数据集包含来自 100 多个品牌的各种汽车，在三种不同的照明条件下收集，包括反射、标准和黑暗。此外，我们为每个实例提供详细的汽车解析地图，以促进汽车解析任务的研究。此外，我们删除背景点云并将汽车方向标准化为统一轴，以便仅在没有背景和可控渲染的汽车上进行重建。我们在 3DRealCar 中的每种照明条件下使用最先进的方法对 3D 重建结果进行基准测试。大量实验表明，3DRealCar的标准光照条件部分可用于生产大量高质量的3D汽车，改善与汽车相关的各种2D和3D任务。值得注意的是，我们的数据集让我们深入了解了这样一个事实：最近的 3D 重建方法在反射和黑暗照明条件下重建高质量 3D 汽车时面临着挑战。 \textcolor{red}{\href{https://xiaobiaodu.github.io/3drealcar/}{我们的数据集可以在这里找到。}}

通过实施合成图像数据集创建管道进行视觉汽车品牌分类

分类： 计算机视觉和模式识别, 机器学习

作者： Jan Lippemeier, Stefanie Hittmeyer, Oliver Niehörster, Markus Lange-Hegermann

发布时间： 2024-06-03

链接： http://arxiv.org/abs/2406.01071v1

摘要： 机器学习的最新进展，特别是深度学习和目标检测方面的进展，显着提高了各种任务的性能，包括图像分类和合成。然而，挑战仍然存在，特别是在获取准确代表特定用例的标记数据方面。在这项工作中，我们提出了一种使用稳定扩散生成合成图像数据集的自动管道，稳定扩散是一种能够生成高度逼真的图像的图像合成模型。我们利用 YOLOv8 进行自动边界框检测和合成图像的质量评估。我们的贡献包括证明仅基于合成数据训练图像分类器的可行性、自动化图像生成管道以及描述我们方法的计算要求。我们评估了不同稳定扩散模式的可用性，并实现了 75% 的分类准确率。