2024-02
ConvDTW-ACS:汽车制造过程中用于轨道类型检测的音频分段
分类: 声音, 音频和语音处理
作者: Álvaro López-Chilet, Zhaoyi Liu, Jon Ander Gómez, Carlos Alvarez, Marivi Alonso Ortiz, Andres Orejuela Mesa, David Newton, Friedrich Wolf-Monheim, Sam Michiels, Danny Hughes
发布时间: 2024-02-28
链接: http://arxiv.org/abs/2402.18204v1
摘要: 本文提出了一种在生产测试轨道上行驶的车辆的音频记录中进行声学约束分割(ACS)的方法,界定轨道中表面类型的边界。 ACS 是经典声学分割的一种变体,其中标签序列是已知的、连续的且不变的,这在这项工作中特别有用,因为测试轨道具有表面类型的标准配置。所提出的 ConvDTW-ACS 方法利用卷积神经网络对从完整音频频谱图中提取的重叠图像块进行分类。然后,我们的自定义动态时间扭曲算法将预测概率序列与轨道中的表面类型序列对齐,从中可以提取表面类型边界的时间戳。该方法在从巴伦西亚(西班牙)福特制造工厂收集的真实世界数据集上进行了评估,在音频内划定赛道表面边界时实现了 166 毫秒的平均误差。结果证明了所提出的方法在准确分割不同表面类型方面的有效性,这可以使开发更专业的人工智能系统来改进质量检测过程。
“它一定是在向我做手势”:自动驾驶车辆和行人之间基于手势的交互
分类: 人机交互, H.5.2
作者: Xiang Chang, Zihe Chen, Xiaoyan Dong, Yuxin Cai, Tingmin Yan, Haolin Cai, Zherui Zhou, Guyue Zhou, Jiangtao Gong
发布时间: 2024-02-22
链接: http://arxiv.org/abs/2402.14455v1
摘要: 由于当前算法和外部人机界面 (eHMI) 的限制,以可理解且高效的方式与行人交互是自动驾驶车辆 (AV) 面临的最严峻的挑战之一。在本文中,我们设计了基于手势的 eHMI,其灵感来自于行人和驾驶员之间最流行的交互方法。我们选择了八种常见的手势来表达自动驾驶汽车在不受控制的人行横道上让行或不让行的意图。通过 VR 实验 (N1 = 31) 和随后的在线调查 (N2 = 394),我们发现基于手势的 eHMI 与当前的 eHMI 相比,在可用性方面存在显着差异。良好的基于手势的 eHMI 可以提高行人与 AV 交互的效率,同时确保安全。然而,不当的手势会导致误解。我们探讨了根本原因:信号接收者的模糊性以及手势是否准确、礼貌且行人熟悉。基于这些经验证据,我们讨论了潜在的机会,并为未来开发可理解的基于手势的 eHMI 提供了宝贵的见解,以支持自动驾驶汽车与其他道路使用者之间更好的交互。
基于大语言模型的自动驾驶混合推理
分类: 计算机视觉和模式识别, 人工智能
作者: Mehdi Azarafza, Mojtaba Nayyeri, Charles Steinmetz, Steffen Staab, Achim Rettberg
发布时间: 2024-02-21
链接: http://arxiv.org/abs/2402.13602v3
摘要: 大型语言模型 (LLM) 因其理解文本和图像、生成类人文本以及执行复杂推理任务的能力而受到广泛关注。然而,他们将这种高级推理与自然语言文本相结合以在动态情况下进行决策的能力还需要进一步探索。在这项研究中,我们研究了大语言模型如何很好地适应和应用算术和常识推理的组合,特别是在自动驾驶场景中。我们假设大语言模型的混合推理能力可以通过分析检测到的物体和传感器数据、了解驾驶法规和物理定律并提供额外的背景来改善自动驾驶。这解决了复杂的场景,例如在能见度较低(由于天气条件)的情况下做出的决策,而传统方法可能无法满足这些场景。我们通过将大型语言模型 (LLM) 的答案与 CARLA 内人类生成的基本事实进行比较,根据准确性评估了大型语言模型 (LLM)。结果表明,当图像(检测到的物体)和传感器数据组合输入 LLM 时,它可以为自动驾驶汽车在各种天气条件下的制动和油门控制提供精确的信息。该公式和答案可以帮助自动驾驶系统的决策。
具有不寻常化学成分的锂造父V708汽车
分类: 太阳和恒星天体物理学
作者: V. V. Kovtyukh, S. M. Andrievsky, K. Werner, S. A. Korotin, A. Y. Kniazev
发布时间: 2024-02-20
链接: http://arxiv.org/abs/2402.13072v1
摘要: 这项工作的目的是对经典造父变星 V708 汽车进行光谱分析。对V708 Car光谱的初步检查表明,这是一颗富含锂的超巨星。我们还发现 V708 汽车具有不寻常的化学成分,各种元素的丰度与其冷凝温度相关。我们试图找到对这一特征的解释,这对于经典造父变星来说是不寻常的。对于光谱分析,我们使用基于局部和非局部热力学平衡假设的方法。我们确定了我们的明星V708汽车的基本参数。这个长周期造父变星的质量约为 12 M$_{\odot}$。我们得出了这颗恒星中 27 种化学元素的丰度。它们与凝结温度明显相关:凝结温度越高,丰度越低(但钠和钡除外)。我们通过这颗恒星包层中的气体尘埃分离来解释 V708 Car 大气层的这种特殊化学成分。类似的机制导致观察到 $\lambda$ Boo、W Vir 和渐近巨分支星的化学成分的特殊性。
学习输入约束控制屏障函数以保证类车机器人的安全
分类: 机器人技术, 系统与控制, 系统与控制
作者: Sven Brüggemann, Dominic Nightingale, Jack Silberman, Maurício de Oliveira
发布时间: 2024-02-19
链接: http://arxiv.org/abs/2402.12512v1
摘要: 我们提出了一种基于输入约束控制屏障函数(ICCBF)的鲁棒安全滤波器的设计方法,用于在复杂环境中移动的类车机器人。通过使用支持向量机回归学习环境的平滑函数,可以获得可以有效实现的鲁棒 ICCBF。该方法考虑了转向约束,并在仿真和实际实验中得到了验证。
超越语音助手:探索车载社交机器人在真实驾驶场景中的优势和风险
分类: 人机交互, 计算机与社会, 机器人技术, 声音
作者: Yuanchao Li, Lachlan Urquhart, Nihan Karatas, Shun Shao, Hiroshi Ishiguro, Xun Shen
发布时间: 2024-02-19
链接: http://arxiv.org/abs/2402.11853v2
摘要: 车载语音助手 (VA) 在汽车用户界面设计中发挥着越来越重要的作用。然而,现有的虚拟助理主要执行简单的“查询-回答”任务,限制了它们维持驾驶员长期注意力的能力。在这项研究中,我们研究了车载机器人助手 (RA) 的有效性,该助手提供语音交互以外的功能。我们的目标是回答这个问题:社交机器人的存在如何影响真实驾驶场景中的用户体验?我们的研究从用户调查开始,以了解对车载虚拟设备的看法及其对驾驶体验的影响。然后,我们与选定的参与者进行非驾驶和道路实验,以评估 RA 的用户体验。此外,我们还进行主观评级来评估用户对 RA 个性的看法,这对于机器人设计至关重要。我们还探讨了有关道德风险的潜在担忧。最后,我们对车载RA的未来发展进行了全面的讨论和建议。
多个阿克曼类汽车机器人的分散式终身路径规划
分类: 机器人技术
作者: Teng Guo, Jingjin Yu
发布时间: 2024-02-19
链接: http://arxiv.org/abs/2402.11767v1
摘要: 连续域中多个非完整机器人的路径规划对许多应用构成了一项艰巨的机器人挑战。尽管该主题最近取得了重大进展,但仍缺乏计算效率高且高质量的解决方案,特别是在机器人必须不断承担新任务的终生环境中。在这项工作中,我们可以将离散域中多机器人规划的最先进(SOTA)方法的关键思想扩展到终身环境中多个阿克曼(类汽车)机器人的运动规划,从而产生高性能集中式和分散式规划器。我们的规划器计算轨迹,使机器人能够达到精确的 $SE(2)$ 目标姿势。我们的方法的有效性通过模拟和现实实验进行了彻底的评估和确认。
2D 自动驾驶汽车的增强型深度 Q 学习:在自定义赛道环境上的实施和评估
分类: 人工智能
作者: Sagar Pathak, Bidhya Shrestha, Kritish Pahi
发布时间: 2024-02-13
链接: http://arxiv.org/abs/2402.08780v1
摘要: 该研究项目介绍了在二维 (2D) 自定义赛道上自动驾驶汽车的深度 Q 学习网络 (DQN) 的实现,旨在增强 DQN 网络的性能。它包括在孟菲斯大学地图周围的赛道上使用 Pygame 开发自定义驾驶环境,以及 DQN 模型的设计和实现。该算法利用安装在汽车上的 7 个传感器的数据,这些传感器测量汽车与轨道之间的距离。这些传感器位于车辆前方,间隔 20 度,使它们能够感知前方的广阔区域。我们成功实现了 DQN 以及具有基于优先级的动作选择机制的 DQN 的修改版本,我们将其称为修改的 DQN。该模型经过 1000 多次训练,发现智能体收到的平均奖励约为 40,比原始 DQN 高出约 60%,比普通神经网络高出约 50%。
通过黑盒模型实现稳健的汽车跟随动力学建模:方法、分析和建议
分类: 机器学习, 机器人技术, 系统与控制, 系统与控制
作者: Muhammad Bilal Shahid, Cody Fleming
发布时间: 2024-02-11
链接: http://arxiv.org/abs/2402.07139v1
摘要: 在学习 GIPPS、IDM 等经典跟车模型的参数时,目标变量的选择很重要。有大量文献表明目标变量对于经典跟车模型来说是最佳的,但没有实证研究评估黑盒模型(例如 LSTM 等)的最佳目标变量的选择。黑盒模型(例如 LSTM 和高斯过程(GP))越来越多地用于对汽车跟随行为进行建模,而无需明智地选择目标变量。目前的工作测试了三种黑盒模型(即 GP、LSTM 和 Kernel Ridge Regression)的不同目标变量,例如加速度、速度和车头时距。这些模型具有不同的目标函数并在不同的向量空间中工作,例如,GP在函数空间中工作,而LSTM在参数空间中工作。实验表明,黑盒模型的最佳目标变量推荐与经典汽车跟随模型不同,具体取决于目标函数和向量空间。值得一提的是,评估过程中使用的模型和数据集本质上是多种多样的:数据集包含自动驾驶车辆轨迹和人类驾驶车辆轨迹;黑盒模型属于参数模型和非参数模型。这种多样性在方差分析中很重要,我们试图找到数据集、模型和目标变量之间的相互作用。结果表明,模型和目标变量相互作用,推荐的目标变量不依赖于所考虑的数据集。