2024-10

一种基于图的在线自学习自动驾驶汽车横向控制器

分类: 机器人技术

作者: Jilan Samiuddin, Benoit Boulet, Di Wu

发布时间: 2024-10-15

链接: http://arxiv.org/abs/2410.11979v1

摘要: 过去几年,围绕自动驾驶汽车的炒作不断升温,并引发了大量研究。自动驾驶汽车的多个模块都经过深入研究,以确保安全性、舒适性和效率,其中控制器至关重要。控制器模块可分为纵向控制器和横向控制器,前者的任务是跟随参考速度,后者的任务是减少相对于参考路径的横向位移误差。通常,经过调整的控制器不足以在所有环境中执行。因此,自动驾驶需要一个能够适应不断变化的条件的控制器。此外,这些控制器通常依赖于车辆模型,这些车辆模型也需要随着时间的推移而适应环境的变化。本文使用图来展示在线学习车辆模型和横向控制器的新技术。首先,呈现一个异构图,描述车辆的当前状态和输入。然后使用已知的物理约束并通过图神经网络结构对图进行处理来在线学习车辆模型。接下来,另一个异构图(描述从当前状态到所需状态的转变)通过另一个图神经网络结构进行处理,以动态生成转向命令。最后,这种基于自学习模型的横向控制器的性能在名为 CARLA 的开源自动驾驶平台上进行了评估,结果显示令人满意。

魁北克汽车保险问答与检索增强生成

分类: 计算和语言

作者: David Beauchemin, Zachary Gagnon, Ricahrd Khoury

发布时间: 2024-10-12

链接: http://arxiv.org/abs/2410.09623v1

摘要: 大型语言模型 (LLM) 在各种下游任务中表现出色,并且检索增强生成 (RAG) 架构的使用已被证明可以提高法律问答的性能(Nuruzzaman 和 Hussain,2020;Louis 等人,2024) 。然而,在保险问答这种特定类型的法律文件中应用有限。本文介绍了两个语料库:魁北克汽车保险专业知识参考语料库和一套 82 个外行汽车保险问题专家答案。我们的研究利用这两个语料库来自动和手动评估 GPT4-o(一种最先进的大语言模型)来回答魁北克汽车保险问题。我们的结果表明,平均而言,使用我们的专业知识参考语料库可以在自动和手动评估指标上产生更好的响应。然而,他们也强调,LLM QA 对于关键领域的大规模使用来说不够可靠。事实上,我们的结果显示,5% 到 13% 的回答问题包含可能导致客户误解的虚假陈述。

RGM:使用 Relightable 3D-GS 生成模型从单个图像重建高保真 3D 汽车资产

分类: 计算机视觉和模式识别

作者: Xiaoxue Chen, Jv Zheng, Hao Huang, Haoran Xu, Weihao Gu, Kangliang Chen, He xiang, Huan-ang Gao, Hao Zhao, Guyue Zhou, Yaqin Zhang

发布时间: 2024-10-10

链接: http://arxiv.org/abs/2410.08181v1

摘要: 高质量 3D 汽车资产的生成对于视频游戏、自动驾驶和虚拟现实等各种应用至关重要。当前的 3D 生成方法利用 NeRF 或 3D-GS 作为 3D 对象的表示,在固定照明下生成朗伯对象,并且缺乏材质和全局照明的独立建模。因此,生成的资产不适合在不同的照明条件下重新照明,从而限制了它们在下游任务中的适用性。为了应对这一挑战,我们提出了一种新颖的可重新点亮的 3D 对象生成框架,该框架可自动创建 3D 汽车资产,从而能够从单个输入图像快速准确地重建车辆的几何形状、纹理和材料属性。我们的方法首先引入一个大规模合成汽车数据集,其中包含 1,000 多个高精度 3D 车辆模型。我们使用全局照明和可重新照明的 3D 高斯基元与 BRDF 参数集成来表示 3D 对象。在此表示的基础上,我们引入了一种前馈模型,该模型将图像作为输入并输出可重新照明的 3D 高斯和全局照明参数。实验结果表明,我们的方法生成的逼真 3D 汽车资产可以无缝集成到具有不同照明的道路场景中,这为工业应用提供了巨大的实际效益。

具有固定幸运车组的停车功能

分类: 组合学, 05

作者: Pamela E. Harris, Lucy Martinez

发布时间: 2024-10-10

链接: http://arxiv.org/abs/2410.08057v1

摘要: 在停车功能中,幸运车是停在其首选停车位的汽车,停车结果是编码汽车在街道上停放顺序的排列。我们对一组固定幸运汽车的停车功能所产生的停车结果进行了表征。该表征涉及排列的下降底部集,我们使用该表征给出了具有固定幸运汽车集的停车函数数量的公式。我们的工作包括汽车数量等于停车位数量以及停车位多于汽车的情况。我们还给出了具有一组固定幸运汽车的弱增加停车函数数量的乘积公式,并且当汽车数量等于停车位数量时,这是加泰罗尼亚数字的乘积。

CAR:用于视觉生成的可控自回归建模

分类: 计算机视觉和模式识别

作者: Ziyu Yao, Jialin Li, Yifeng Zhou, Yong Liu, Xi Jiang, Chengjie Wang, Feng Zheng, Yuexian Zou, Lei Li

发布时间: 2024-10-07

链接: http://arxiv.org/abs/2410.04671v1

摘要: 可控生成能够对生成的输出进行细粒度控制,已成为视觉生成模型的关键焦点。目前,视觉生成主要有两种技术方法:扩散模型和自回归模型。以 ControlNet 和 T2I-Adapter 为代表的扩散模型提供了先进的控制机制,而自回归模型尽管展示了令人印象深刻的生成质量和可扩展性,但在可控性和灵活性方面仍未得到充分探索。在本研究中,我们引入了可控自回归建模(CAR),这是一种新颖的即插即用框架,它将条件控制集成到多尺度潜变量建模中,从而在预先训练的视觉自回归模型中实现高效的控制生成。 CAR 逐步细化并捕获控制表示,这些表示被注入到预训练模型的每个自回归步骤中以指导生成过程。与以前的方法相比,我们的方法在各种类型的条件下表现出出色的可控性,并提供更高的图像质量。此外,与预训练模型所需的资源相比,CAR 可以用更少的训练资源实现强大的泛化。据我们所知,我们是第一个提出预训练自回归视觉生成模型的控制框架的人。

IC3M:车内驾乘人员异常状态多模态多目标监测

分类: 计算机视觉和模式识别, 人工智能, 机器学习, 系统与控制, 系统与控制

作者: Zihan Fang, Zheng Lin, Senkang Hu, Hangcheng Cao, Yiqin Deng, Xianhao Chen, Yuguang Fang

发布时间: 2024-10-03

链接: http://arxiv.org/abs/2410.02592v3

摘要: 近年来,车载监控已成为检测驾驶员早期异常状态并及时发出警报以预防交通事故的一项有前景的技术。虽然多模态数据的训练模型增强了异常状态检测的可靠性,但标记数据的稀缺和类别分布的不平衡阻碍了关键异常状态特征的提取,从而显着恶化了训练性能。此外,由于环境和硬件限制而导致的模式缺失进一步加剧了异常状态识别的挑战。更重要的是,监测乘客的异常健康状况,特别是在老年人护理方面,至关重要,但尚未得到充分探索。为了应对这些挑战,我们推出了 IC3M,这是一种基于摄像头旋转的高效多模式框架,用于监控汽车中的驾驶员和乘客。我们的 IC3M 包含两个关键模块:自适应阈值伪标记策略和缺失模态重建。前者根据类分布为不同类定制伪标签阈值,生成类平衡的伪标签来有效指导模型训练,而后者利用从有限标签中学习到的跨模态关系,通过从可用模态转移的分布来准确恢复丢失的模态。大量实验结果表明,IC3M 在准确性、精确度和召回率方面优于最先进的基准,同时在有限的标记数据和严重缺失模态下表现出卓越的鲁棒性。

杜宾斯汽车从多边形中的最短时间逃生

分类: 系统与控制, 系统与控制, 49J15, 49N90, 51P05

作者: Isaac E. Weintraub, Alexander Von Moll, David Casbeer, Satyanarayana G Manyam, Meir Pachter, Colin Taylor

发布时间: 2024-10-02

链接: http://arxiv.org/abs/2410.01589v1

摘要: 转弯受限的车辆最初位于多边形区域内,并希望在最短的时间内逃脱。首先,使用特征方法来描述到达无限长度线的时间最优策略。接下来,该方法扩展到由一系列线段构成的多边形。使用这种构造技术,可以获得到达每个边缘的最短时间路径;然后选择最优轨迹组中所得的最小值来逃离多边形。

汽车交通事故的概率建模

分类: 物理与社会, 可能性, 65C20, 76A30

作者: Simone Göttlich, Thomas Schillinger, Andrea Tosin

发布时间: 2024-10-01

链接: http://arxiv.org/abs/2410.00446v1

摘要: 我们引入计数过程来模拟汽车交通事故随机发生的时间,并考虑到这种现象的典型自励磁的某些方面。通过结合概率和微分方程的方法,我们从统计矩和大时间趋势的角度研究了这种随机过程。此外,我们分析推导了交通事故发生次数和两次连续事故之间经过时间的概率密度函数。最后,我们通过数值模拟证明了我们的建模方法的适用性,该方法还可以与交通事故每周趋势的真实数据进行比较。

相关