Fugu-MT 論文翻訳(概要): Interacting safely with cyclists using Hamilton-Jacobi reachability and reinforcement learning

論文の概要: Interacting safely with cyclists using Hamilton-Jacobi reachability and reinforcement learning

arxiv url: http://arxiv.org/abs/2602.18097v1
Date: Fri, 20 Feb 2026 09:38:38 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-23 18:01:41.284207
Title: Interacting safely with cyclists using Hamilton-Jacobi reachability and reinforcement learning
Title（参考訳）: Hamilton-Jacobiリーチビリティと強化学習を用いたサイクリストの安全対応
Authors: Aarati Andrea Noronha, Jean Oh,
Abstract要約: 安全と最適性のバランスをとる方法で、自動運転車がサイクリストと対話できるようにするための枠組みを提案する。このアプローチは、ハミルトン・ヤコビの到達可能性分析と深層Q-ラーニングを統合し、安全保証と時間効率のナビゲーションに共同で対処する。
参考スコア（独自算出の注目度）: 11.479997869496797
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we present a framework for enabling autonomous vehicles to interact with cyclists in a manner that balances safety and optimality. The approach integrates Hamilton-Jacobi reachability analysis with deep Q-learning to jointly address safety guarantees and time-efficient navigation. A value function is computed as the solution to a time-dependent Hamilton-Jacobi-Bellman inequality, providing a quantitative measure of safety for each system state. This safety metric is incorporated as a structured reward signal within a reinforcement learning framework. The method further models the cyclist's latent response to the vehicle, allowing disturbance inputs to reflect human comfort and behavioral adaptation. The proposed framework is evaluated through simulation and comparison with human driving behavior and an existing state-of-the-art method.
Abstract（参考訳）: 本稿では,安全と最適性のバランスを保ちながら,自動運転車がサイクリストと対話することを可能にする枠組みを提案する。このアプローチは、ハミルトン・ヤコビの到達可能性分析と深層Q-ラーニングを統合し、安全保証と時間効率のナビゲーションに共同で対処する。値関数は時間依存のハミルトン・ヤコビ・ベルマン不等式に対する解として計算され、各系状態に対する安全性の定量的尺度を提供する。この安全度は、強化学習フレームワーク内に構造化された報酬信号として組み込まれている。この方法は、サイクリストの車両に対する潜伏反応をモデル化し、外乱入力を人間の快適さと行動適応を反映させる。提案手法は,人間の運転行動と既存技術との比較とシミュレーションにより評価される。

関連論文リスト

AI2-Active Safety: AI-enabled Interaction-aware Active Safety Analysis with Vehicle Dynamics [8.557684007368046]
本稿では,AIを利用した対話型アクティブ安全分析フレームワークを提案する。このフレームワークは、道路勾配を考慮した自転車モデルを用いて、車両のダイナミクスを正確に捉える。並行して、ハイパーグラフベースのAIモデルが開発され、環境トラフィックの確率的軌跡を予測する。
論文参考訳（メタデータ） (2025-05-01T05:46:34Z)
Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [87.7482313774741]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文参考訳（メタデータ） (2024-09-19T14:36:00Z)
Autonomous Vehicle Decision-Making Framework for Considering Malicious Behavior at Unsignalized Intersections [7.245712580297489]
自動運転車では、報酬信号は安全や効率などのフィードバック要因に関する通常の報酬として設定される。本稿では,緊急時の安全性を高めるために,可変重み付けパラメータによって安全ゲインを変調する。この決定フレームワークは、無人の交差点で潜在的に悪意のある振る舞いをする車両に遭遇する際に、自律走行車両が情報的決定を行うことを可能にする。
論文参考訳（メタデータ） (2024-09-11T03:57:44Z)
Safeguarded Progress in Reinforcement Learning: Safe Bayesian Exploration for Control Policy Synthesis [63.532413807686524]
本稿では、強化学習(RL)におけるトレーニング中の安全維持の問題に対処する。探索中の効率的な進捗と安全性のトレードオフを扱う新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (2023-12-18T16:09:43Z)
Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。 LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文参考訳（メタデータ） (2023-11-28T03:13:09Z)
Evaluating Model-free Reinforcement Learning toward Safety-critical Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文参考訳（メタデータ） (2022-12-12T06:30:17Z)
Evaluation of Pedestrian Safety in a High-Fidelity Simulation Environment Framework [21.456269382916062]
本稿では,自動運転のための歩行者安全評価手法を提案する。歩行者の安全に重要な特徴を組み込んだ高忠実度シミュレーションフレームワークを構築した。提案手法とフレームワークは、異なる自律運転アルゴリズムにアクセスできる。
論文参考訳（メタデータ） (2022-10-17T03:53:50Z)
Safety-aware Policy Optimisation for Autonomous Racing [17.10371721305536]
ハミルトン・ヤコビ(HJ)到達可能性理論を制約付きマルコフ決定過程(CMDP)フレームワークに導入する。我々は,HJの安全性を視覚的文脈で直接学習できることを実証した。我々は、最近リリースされた高忠実な自律走行環境であるSafety GymやLearning-to-Race (L2R)など、いくつかのベンチマークタスクにおいて、本手法の評価を行った。
論文参考訳（メタデータ） (2021-10-14T20:15:45Z)
Analyzing vehicle pedestrian interactions combining data cube structure and predictive collision risk estimation model [5.73658856166614]
本研究では,フィールドと集中型プロセスを組み合わせた歩行者安全システムについて紹介する。本システムは,現場における今後のリスクを直ちに警告し,実際の衝突のない道路の安全レベルを評価することにより,危険頻繁なエリアの安全性を向上させることができる。
論文参考訳（メタデータ） (2021-07-26T23:00:56Z)
Improving Robustness of Learning-based Autonomous Steering Using Adversarial Images [58.287120077778205]
自動運転用画像入力における学習アルゴリズムw.r.tの堅牢性を解析するためのフレームワークについて紹介する。感度分析の結果を用いて, 「操縦への学習」タスクの総合的性能を向上させるアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-02-26T02:08:07Z)
Cautious Reinforcement Learning with Logical Constraints [78.96597639789279]
適応型安全なパッドディングは、学習プロセス中の安全性を確保しつつ、RL(Reinforcement Learning)に最適な制御ポリシーの合成を強制する。理論的な保証は、合成されたポリシーの最適性と学習アルゴリズムの収束について利用できる。
論文参考訳（メタデータ） (2020-02-26T00:01:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。