論文の概要: Interacting safely with cyclists using Hamilton-Jacobi reachability and reinforcement learning
- arxiv url: http://arxiv.org/abs/2602.18097v1
- Date: Fri, 20 Feb 2026 09:38:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.284207
- Title: Interacting safely with cyclists using Hamilton-Jacobi reachability and reinforcement learning
- Title(参考訳): Hamilton-Jacobiリーチビリティと強化学習を用いたサイクリストの安全対応
- Authors: Aarati Andrea Noronha, Jean Oh,
- Abstract要約: 安全と最適性のバランスをとる方法で、自動運転車がサイクリストと対話できるようにするための枠組みを提案する。
このアプローチは、ハミルトン・ヤコビの到達可能性分析と深層Q-ラーニングを統合し、安全保証と時間効率のナビゲーションに共同で対処する。
- 参考スコア(独自算出の注目度): 11.479997869496797
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a framework for enabling autonomous vehicles to interact with cyclists in a manner that balances safety and optimality. The approach integrates Hamilton-Jacobi reachability analysis with deep Q-learning to jointly address safety guarantees and time-efficient navigation. A value function is computed as the solution to a time-dependent Hamilton-Jacobi-Bellman inequality, providing a quantitative measure of safety for each system state. This safety metric is incorporated as a structured reward signal within a reinforcement learning framework. The method further models the cyclist's latent response to the vehicle, allowing disturbance inputs to reflect human comfort and behavioral adaptation. The proposed framework is evaluated through simulation and comparison with human driving behavior and an existing state-of-the-art method.
- Abstract(参考訳): 本稿では,安全と最適性のバランスを保ちながら,自動運転車がサイクリストと対話することを可能にする枠組みを提案する。
このアプローチは、ハミルトン・ヤコビの到達可能性分析と深層Q-ラーニングを統合し、安全保証と時間効率のナビゲーションに共同で対処する。
値関数は時間依存のハミルトン・ヤコビ・ベルマン不等式に対する解として計算され、各系状態に対する安全性の定量的尺度を提供する。
この安全度は、強化学習フレームワーク内に構造化された報酬信号として組み込まれている。
この方法は、サイクリストの車両に対する潜伏反応をモデル化し、外乱入力を人間の快適さと行動適応を反映させる。
提案手法は,人間の運転行動と既存技術との比較とシミュレーションにより評価される。
関連論文リスト
- AI2-Active Safety: AI-enabled Interaction-aware Active Safety Analysis with Vehicle Dynamics [8.557684007368046]
本稿では,AIを利用した対話型アクティブ安全分析フレームワークを提案する。
このフレームワークは、道路勾配を考慮した自転車モデルを用いて、車両のダイナミクスを正確に捉える。
並行して、ハイパーグラフベースのAIモデルが開発され、環境トラフィックの確率的軌跡を予測する。
論文 参考訳(メタデータ) (2025-05-01T05:46:34Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [87.7482313774741]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Autonomous Vehicle Decision-Making Framework for Considering Malicious
Behavior at Unsignalized Intersections [7.245712580297489]
自動運転車では、報酬信号は安全や効率などのフィードバック要因に関する通常の報酬として設定される。
本稿では,緊急時の安全性を高めるために,可変重み付けパラメータによって安全ゲインを変調する。
この決定フレームワークは、無人の交差点で潜在的に悪意のある振る舞いをする車両に遭遇する際に、自律走行車両が情報的決定を行うことを可能にする。
論文 参考訳(メタデータ) (2024-09-11T03:57:44Z) - Safeguarded Progress in Reinforcement Learning: Safe Bayesian
Exploration for Control Policy Synthesis [63.532413807686524]
本稿では、強化学習(RL)におけるトレーニング中の安全維持の問題に対処する。
探索中の効率的な進捗と安全性のトレードオフを扱う新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-12-18T16:09:43Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z) - Evaluating Model-free Reinforcement Learning toward Safety-critical
Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。
安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。
この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文 参考訳(メタデータ) (2022-12-12T06:30:17Z) - Evaluation of Pedestrian Safety in a High-Fidelity Simulation Environment Framework [21.456269382916062]
本稿では,自動運転のための歩行者安全評価手法を提案する。
歩行者の安全に重要な特徴を組み込んだ高忠実度シミュレーションフレームワークを構築した。
提案手法とフレームワークは、異なる自律運転アルゴリズムにアクセスできる。
論文 参考訳(メタデータ) (2022-10-17T03:53:50Z) - Analyzing vehicle pedestrian interactions combining data cube structure
and predictive collision risk estimation model [5.73658856166614]
本研究では,フィールドと集中型プロセスを組み合わせた歩行者安全システムについて紹介する。
本システムは,現場における今後のリスクを直ちに警告し,実際の衝突のない道路の安全レベルを評価することにより,危険頻繁なエリアの安全性を向上させることができる。
論文 参考訳(メタデータ) (2021-07-26T23:00:56Z) - Improving Robustness of Learning-based Autonomous Steering Using
Adversarial Images [58.287120077778205]
自動運転用画像入力における学習アルゴリズムw.r.tの堅牢性を解析するためのフレームワークについて紹介する。
感度分析の結果を用いて, 「操縦への学習」 タスクの総合的性能を向上させるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-26T02:08:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。