2023-10

自动驾驶汽车的社交互动感知动态模型和决策

分类: 人机交互, 计算机与社会, 机器人技术, 系统与控制, 系统与控制

作者: Luca Crosato, Kai Tian, Hubert P. H Shum, Edmond S. L. Ho, Yafei Wang, Chongfeng Wei

发布时间: 2023-10-29

链接: http://arxiv.org/abs/2310.18891v2

摘要: 交互感知自动驾驶 (IAAD) 是一个快速发展的研究领域,专注于开发能够与人类道路使用者安全高效交互的自动驾驶车辆 (AV)。这是一项具有挑战性的任务,因为它要求自动驾驶车辆能够理解和预测人类道路使用者的行为。在这篇文献综述中,本文对 IAAD 研究的现状进行了调查。从术语检查开始,重点关注用于模拟驾驶员和行人行为的挑战和现有模型。接下来,对交互建模提出的各种技术进行了全面的回顾,包括认知方法、机器学习方法和博弈论方法。该结论是通过讨论与 IAAD 相关的潜在优势和风险以及阐明未来探索所需的关键研究问题而得出的。

LaksNet:Udacity 模拟器中自动驾驶汽车的端到端深度学习模型

分类: 计算机视觉和模式识别

作者: Lakshmikar R. Polamreddy, Youshan Zhang

发布时间: 2023-10-24

链接: http://arxiv.org/abs/2310.16103v1

摘要: 大多数道路事故是由于人为失误造成的,包括分心、鲁莽和酒后驾驶。克服这种危险情况的有效方法之一是在车辆中实施自动驾驶技术。在本文中,我们专注于为自动驾驶汽车构建高效的深度学习模型。我们提出了一种新的有效的卷积神经网络模型,称为“LaksNet”,由四个卷积层和两个全连接层组成。我们使用 LaksNet 模型以及 Udacity 模拟器生成的训练数据进行了广泛的实验。就车辆在模拟器上不脱离赛道的行驶持续时间而言,我们的模型优于许多现有的预训练 ImageNet 和 NVIDIA 模型。

用于简化汽车销售流程的车型识别系统

分类: 计算机视觉和模式识别

作者: Said Togru, Marco Moldovan

发布时间: 2023-10-19

链接: http://arxiv.org/abs/2310.13198v2

摘要: 该项目提出了一种用于有效识别汽车型号和图像制造商的自动化解决方案,旨在简化在线汽车销售平台上的车辆上市流程。通过对各种高效网络架构(包括卷积神经网络 (CNN)、视觉变换器 (ViT) 和混合模型)的彻底探索,我们采用 EfficientNet (V2 b2) 架构实现了 81.97% 的显着准确率。为了提高性能,采用了多种策略组合,包括数据增强、微调预训练模型和广泛的超参数调整。经过训练的模型提供了自动信息提取的潜力,有望增强汽车销售网站的用户体验。

HIFuzz:小型无人机的人机交互模糊测试

分类: 人机交互

作者: Theodore Chambers, Michael Vierhauser, Ankit Agrawal, Michael Murphy, Jason Matthew Brauer, Salil Purandare, Myra B. Cohen, Jane Cleland-Huang

发布时间: 2023-10-18

链接: http://arxiv.org/abs/2310.12058v2

摘要: 小型无人机系统(sUAS)在高压力应急响应场景中部署时必须满足严格的安全标准;然而,许多报道的事故都涉及人类。因此,在本文中,我们提出了 HiFuzz 测试框架,该框架使用模糊测试来识别与人类交互相关的系统漏洞。 HiFuzz 包括三个不同的级别,从使用完全模拟的代理人类代理的低成本、有限保真度、大规模、无危险的环境,经过中间级别(其中代理人类被替换为真实的人类),到高级。 - 风险、高成本、现实环境。通过将 HiFuzz 应用于被测自主多无人机系统,我们表明每个测试级别都有一个独特的目的,即揭示漏洞并使系统在人为错误方面更加稳健。虽然 HiFuzz 是为测试 sUAS 系统而设计的,但我们进一步讨论了其在其他网络物理系统中使用的潜力。

自动驾驶车辆操作过程中驾驶员安全注意力的分类

分类: 机器人技术, 计算机视觉和模式识别, 人机交互

作者: Santiago Gerling Konrad, Julie Stephany Berrio, Mao Shan, Favio Masson, Stewart Worrall

发布时间: 2023-10-17

链接: http://arxiv.org/abs/2310.11608v1

摘要: 尽管高级驾驶辅助系统 (ADAS) 不断进步,高级自动驾驶汽车 (AV) 不断发展,但人们普遍认为,在中短期内,需要一名人类主管来处理边缘问题不可避免会出现的情况。鉴于这一要求,必须对车辆操作员的状态进行监控,以确保他们为车辆的安全运行做出贡献。本文介绍了一种双源方法,集成来自面向车辆操作员的红外摄像头和车辆感知系统的数据,以生成驾驶员警觉性指标,以促进和确保安全操作员行为。红外摄像头检测驾驶员的头部,从而能够计算头部方向,这是相关的,因为头部通常根据个人的注意力焦点移动。通过结合来自感知系统的环境数据,可以确定车辆操作员是否观察到周围的物体。使用在澳大利亚悉尼收集的数据进行实验,模拟城市环境中的自动驾驶汽车操作。我们的结果表明,所提出的系统有效地确定了车辆操作员注意力水平的指标,从而可以适当地进行警告或减少自主功能等干预措施。这一全面的解决方案有望在现实环境中为 ADAS 和自动驾驶汽车的整体安全性和效率做出贡献。

用于电力电子参数设计的连续自适应随机采样 (CARS)

分类: 机器学习

作者: Dominik Happel, Philipp Brendel, Andreas Rosskopf, Stefan Ditze

发布时间: 2023-10-16

链接: http://arxiv.org/abs/2310.10425v1

摘要: 迄今为止,电力电子参数设计任务通常使用详细的优化方法和详细的仿真来解决,或者使用强力网格搜索和非常快速的仿真来解决。提出了一种名为“连续自适应随机采样”(CARS)的新方法,它提供了介于两者之间的连续方法。这允许非常快速和/或大量的模拟,但越来越关注最有希望的参数范围。灵感来自于多臂老虎机研究,并导致在一个高维参数张量中对子域进行优先采样。性能已经在三个示例性电力电子用例上进行了评估,其中最终的设计似乎与遗传算法具有竞争力,但另外还允许高度并行化的模拟,以及探索性和利用性设置之间的连续进展。

CarExpert:利用大型语言模型进行车内对话式问答

分类: 计算和语言, 信息检索, 机器学习

作者: Md Rashad Al Hasan Rony, Christian Suess, Sinchana Ramakanth Bhat, Viju Sudhi, Julia Schneider, Maximilian Vogel, Roman Teucher, Ken E. Friedl, Soumya Sahoo

发布时间: 2023-10-14

链接: http://arxiv.org/abs/2310.09536v1

摘要: 大型语言模型 (LLM) 通过遵循自然语言指令而无需针对特定领域的任务和数据进行微调,从而表现出了卓越的性能。然而,利用大语言模型进行特定领域的问答受到严重限制。由于训练数据收集时间(使用现成的时)、复杂的用户话语和错误的检索(在检索增强生成中),生成的答案往往会产生幻觉。此外,由于缺乏对领域和预期输出的认识,此类大语言模型可能会生成不适合目标领域的意外且不安全的答案。在本文中,我们提出了 CarExpert,这是一种车内检索增强型对话问答系统,利用大语言模型来完成不同的任务。具体来说,CarExpert 采用 LLM 来控制输入,向提取和生成回答组件提供特定领域的文档,并控制输出以确保安全和特定领域的答案。全面的实证评估表明,CarExpert 在生成自然、安全和针对汽车的答案方面优于最先进的大语言模型。

用于训练拉曼和 CARS 光谱中贝叶斯神经网络的对数高斯伽玛过程

分类: 应用领域, 机器学习, 62F15, 60G10, 62M45 (Primary) 78M31 (Secondary)

作者: Teemu Härkönen, Erik M. Vartiainen, Lasse Lensu, Matthew T. Moores, Lassi Roininen

发布时间: 2023-10-12

链接: http://arxiv.org/abs/2310.08055v2

摘要: 我们提出了一种利用伽马分布随机变量与对数高斯建模相结合的方法,来生成适合训练神经网络的合成数据集。这解决了各种应用中实际观察有限的挑战。我们将此方法应用于拉曼光谱和相干反斯托克斯拉曼散射(CARS)光谱,使用实验光谱来估计伽马过程参数。使用马尔可夫链蒙特卡罗方法进行参数估计,产生模型的完整贝叶斯后验分布,可以对其进行采样以生成合成数据。此外,我们还使用高斯过程对拉曼和 CARS 的加法和乘法背景函数进行建模。我们训练两个贝叶斯神经网络来估计伽马过程的参数,然后该参数可用于估计基础拉曼光谱,并同时通过概率分布参数的估计提供不确定性。我们将经过训练的贝叶斯神经网络应用于酞菁蓝、苯胺黑、萘酚红和红 264 颜料的实验拉曼光谱,以及磷酸腺苷、果糖、葡萄糖和蔗糖的实验 CARS 光谱。结果与基础拉曼和 CARS 光谱特征的确定性点估计一致。

您会相信有车辆并入您的车道吗?拥堵并道场景下谈判行为的主观评价

分类: 人机交互

作者: Akinobu Goto, Kerstin Eder

发布时间: 2023-10-12

链接: http://arxiv.org/abs/2310.08361v1

摘要: 为了实现人类和自动驾驶汽车可以合作共存的社会,了解什么是合作和值得信赖的行为对于设计自动驾驶汽车控制器至关重要,从而将高度自动化的汽车集成到现实世界中。本研究调查了合道车辆如何在需要显式和隐式通信的拥堵合道情况下获得人类驾驶车辆的信任。具体来说,本研究从主流车道主车辆的角度考察了并道车辆在并道准备阶段的不同行为如何影响感知信任。研究结果表明,透明的纵向定位可以提高并道成功的机会,并且在并道准备期间的合作减速可以增强主车辆感知到的信任。此外,结果表明,在合流车辆接近车道关闭点的时间敏感情况下,合流车辆迅速而果断的行动会鼓励与主车辆建立信任;任何延迟或犹豫都可能导致信任度降低。研究结果可以为开发协作式自动驾驶汽车提供宝贵的见解,从而提高涉及人类的现实交通情况的安全性和效率。

接收、推理和反应:使用自动驾驶汽车中的大型语言模型按您所说的方式驾驶

分类: 人机交互, 人工智能, 机器人技术

作者: Can Cui, Yunsheng Ma, Xu Cao, Wenqian Ye, Ziran Wang

发布时间: 2023-10-12

链接: http://arxiv.org/abs/2310.08034v1

摘要: 以人为本的设计和人工智能 (AI) 功能的融合为下一代自动驾驶汽车带来了超越交通的新可能性。这些车辆可以与乘客动态互动并适应他们的喜好。本文提出了一种利用大型语言模型(LLM)来增强自动驾驶汽车决策过程的新颖框架。通过利用专业工具的大语言模型的语言和上下文理解能力,我们的目标是将大语言模型的语言和推理能力集成到自动驾驶汽车中。我们的研究包括在 HighwayEnv(自动驾驶和战术决策任务的环境集合)中进行实验,以探索大语言模型在各种场景中的解释、交互和推理。我们还研究了实时个性化,展示了大语言模型如何根据口头命令影响驾驶行为。我们的实证结果强调了利用思维链提示的巨大优势,可以改善驾驶决策,并显示​​大语言模型通过持续的口头反馈增强个性化驾驶体验的潜力。拟议的框架旨在改变自动驾驶汽车的运营,提供个性化支持、透明决策和持续学习,以提高安全性和有效性。通过将大语言模型集成到自动驾驶汽车中,我们实现了以用户为中心、透明且自适应的自动驾驶生态系统。

评估用于收集安全关键车辆与行人交互的 VR 系统

分类: 人机交互

作者: Erica Weng, Kenta Mukoya, Deva Ramanan, Kris Kitani

发布时间: 2023-10-09

链接: http://arxiv.org/abs/2310.05882v1

摘要: 自动驾驶车辆(AV)需要全面可靠的行人轨迹数据以确保安全运行。然而,获取安全关键场景(例如乱穿马路和险些发生碰撞)或不常见行为体(例如儿童、残疾行人和弱势道路使用者)的数据会带来后勤和道德挑战。本文评估了一种虚拟现实 (VR) 系统,该系统旨在在受控的低风险环境中收集行人轨迹和身体姿势数据。我们通过对 AV 领域专业人士的半结构化访谈证实了该系统的实用性,并通过两项实证研究验证了该系统的有效性:一项涉及 62 名参与者的第一人称用户评估,以及一项涉及 62 名参与者的第三人称评估调查290 名受访者。我们的研究结果表明,基于 VR 的数据收集系统能够在安全关键或不常见的车辆与行人交互场景中捕获行人数据时产生真实的响应。

拥堵交通中的在线公平乘车共享汽车分配

分类: 系统与控制, 系统与控制

作者: Hossein Rastgoftar

发布时间: 2023-10-08

链接: http://arxiv.org/abs/2310.05305v2

摘要: 蜂窝通信的进步大大提高了 Uber 和 Lyft 等拼车服务的可用性。这种技术驱动的交通系统可以减少物理容量有限的道路上的私家车数量,有效地将司机与请求服务的乘客进行匹配,并通过优化行程安排和估计来节省司机和乘客的时间。然而,如果城市地区无法公平地获得乘车共享公司提供的现有服务,则不一定能减少拥堵。本文通过将汽车分为乘车共享汽车和非乘车共享汽车,并开发一种新颖的基于分歧的交通演化动力学来有效地模拟它们在共享互联道路网络(NOIR)中的分布,从而解决了这个重要问题。这种新的动力学将共享汽车演化建模为非平稳马尔可夫过程,不确定性矩阵分解为流出概率矩阵和趋势概率矩阵,其中流出概率受到非共享汽车行为的约束,但趋势概率被认为是用于在拥堵交通中实现共享汽车的公平分配的决策变量(或分布式控制)。

自动模型汽车的室内定位:基于标记的多传感器融合框架

分类: 机器人技术

作者: Xibo Li, Shruti Patel, David Stronzek-Pfeifer, Christof Büskens

发布时间: 2023-10-08

链接: http://arxiv.org/abs/2310.05198v1

摘要: 在户外定位机器人时,全球导航卫星系统可以轻松提供准确的位置信息。然而,对于室内操作的移动机器人来说,尚不存在类似的标准解决方案。本文提出了一个基于高级驾驶辅助系统 (ADAS) 模型汽车的自动驾驶系统室内定位和实验验证的集成框架。模型车的全局姿态是通过融合基准标记、惯性传感器和车轮里程计的信息获得的。为了实现稳健的定位,我们研究并比较了扩展卡尔曼滤波器的两种扩展;第一个是自适应噪声调谐,第二个是用于测量异常值检测的卡方检验。还提出了一种使用单个激光雷达传感器的高效且低成本的地面实况测量方法来验证结果。定位算法的性能在具有轨迹规划和模型预测控制的完整自动驾驶系统上进行了测试。

自动驾驶车辆人类首选路径规划的曲线轨迹模型

分类: 机器人技术, 人机交互

作者: Gergo Igneczi, Erno Horvath, Roland Toth, Krisztian Nyilas

发布时间: 2023-10-04

链接: http://arxiv.org/abs/2310.02696v1

摘要: 自动驾驶系统通常用于车道保持任务。通过这些系统,可以在车辆前方规划一条本地路径。然而,人类驾驶员经常发现这些路径不自然。我们提出了一种线性驾驶员模型,它可以计算反映人类驾驶员偏好的节点,并基于这些节点可以为自动驾驶设计人类驾驶员首选的运动路径。模型输入是道路曲率。我们将该模型应用到自主开发的基于欧拉曲线的曲线拟合算法中。通过案例研究,我们表明基于模型的规划路径可以重现人类曲线路径选择的平均行为。我们通过统计分析来分析所提出模型的性能,显示所捕获关系的有效性。

一切以您为中心:使用飞行时间摄像头进行个性化车载手势识别

分类: 计算机视觉和模式识别, 人工智能, 人机交互

作者: Amr Gomaa, Guillermo Reyes, Michael Feld

发布时间: 2023-10-02

链接: http://arxiv.org/abs/2310.01659v1

摘要: 尽管手势识别技术取得了重大进步,但由于数据有限且昂贵,而且其动态、不断变化的性质,在驾驶环境中识别手势仍然具有挑战性。在这项工作中,我们提出了一种模型自适应方法来个性化 CNNLSTM 模型的训练并提高识别准确性,同时减少数据需求。我们的方法通过提供一种可以为个人用户定制的更高效、更准确的方法,为驾驶时动态手势识别领域做出贡献,最终增强车内交互的安全性和便利性,以及驾驶员的体验和系统信任度。我们将使用飞行时间相机的硬件增强和通过数据增强、个性化适应和增量学习技术的算法增强结合起来。我们评估了我们的方法在识别准确率方面的表现,达到了 90%,并展示了个性化适应和增量学习对于以用户为中心的设计的有效性。

相关