論文の概要: Reinforcement Learning Enhancement Using Vector Semantic Representation and Symbolic Reasoning for Human-Centered Autonomous Emergency Braking
- arxiv url: http://arxiv.org/abs/2602.05079v1
- Date: Wed, 04 Feb 2026 21:56:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.636147
- Title: Reinforcement Learning Enhancement Using Vector Semantic Representation and Symbolic Reasoning for Human-Centered Autonomous Emergency Braking
- Title(参考訳): 人中心型自律型緊急ブレーキにおけるベクトルセマンティック表現とシンボリック推論を用いた強化学習の促進
- Authors: Vinal Asodia, Iman Sharifi, Saber Fallah,
- Abstract要約: 本稿では,意味情報,空間情報,形状情報を含むニューロシンボリックな特徴表現を生成するパイプラインを提案する。
また、シンボル推論モジュールを介して人間の値のバランスをとるソフト・ファースト・オーダー・ロジック(SFOL)報酬関数を提案する。
この結果から,総合的な表現とソフト推論を強化学習に統合することで,自律運転におけるコンテキスト認識と価値整合型意思決定を支援することが示唆された。
- 参考スコア(独自算出の注目度): 4.3152045411139675
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The problem with existing camera-based Deep Reinforcement Learning approaches is twofold: they rarely integrate high-level scene context into the feature representation, and they rely on rigid, fixed reward functions. To address these challenges, this paper proposes a novel pipeline that produces a neuro-symbolic feature representation that encompasses semantic, spatial, and shape information, as well as spatially boosted features of dynamic entities in the scene, with an emphasis on safety-critical road users. It also proposes a Soft First-Order Logic (SFOL) reward function that balances human values via a symbolic reasoning module. Here, semantic and spatial predicates are extracted from segmentation maps and applied to linguistic rules to obtain reward weights. Quantitative experiments in the CARLA simulation environment show that the proposed neuro-symbolic representation and SFOL reward function improved policy robustness and safety-related performance metrics compared to baseline representations and reward formulations across varying traffic densities and occlusion levels. The findings demonstrate that integrating holistic representations and soft reasoning into Reinforcement Learning can support more context-aware and value-aligned decision-making for autonomous driving.
- Abstract(参考訳): 既存のカメラベースのDeep Reinforcement Learningアプローチの問題は2つある。高レベルのシーンコンテキストを特徴表現に統合することは滅多になく、厳密で固定された報酬関数に依存している。
これらの課題に対処するため,本稿では,情緒的,空間的,形状的な情報を含むニューロシンボリックな特徴表現と,現場におけるダイナミックな実体の特徴を空間的に向上させるパイプラインを提案する。
また、シンボル推論モジュールを介して人間の値のバランスをとるソフト・ファースト・オーダー・ロジック(SFOL)報酬関数を提案する。
ここでは、セグメンテーションマップから意味的および空間的述語を抽出し、言語規則に適用し、報酬重みを求める。
CARLAシミュレーション環境における定量的実験により,提案したニューロシンボリック表現とSFOL報酬関数は,各種交通密度および閉塞レベルに対するベースライン表現および報酬定式化と比較して,ポリシーロバスト性および安全関連性能指標を改善した。
この結果から,総合的な表現とソフト推論を強化学習に統合することで,自律運転におけるコンテキスト認識と価値整合型意思決定を支援することが示唆された。
関連論文リスト
- LinguaFluid: Language Guided Fluid Control via Semantic Rewards in Reinforcement Learning [0.7864304771129751]
本研究では,現在状態と目標意味的指示とを一致させて報酬を計算できる意味的整合強化学習手法を提案する。
我々は,手作りの報酬関数がなくても,意味報酬は学習を指導して,競争力のある制御動作を実現することができることを示した。
このフレームワークは、エージェントの振る舞いを自然言語の目標と整合させるための新たな地平を開き、より大きな言語モデルのよりシームレスな統合の基礎となる。
論文 参考訳(メタデータ) (2025-08-08T03:23:56Z) - Feature-Based vs. GAN-Based Learning from Demonstrations: When and Why [50.191655141020505]
この調査は、デモから学ぶ機能ベースのアプローチとGANベースのアプローチの比較分析を提供する。
特徴に基づく手法とGANに基づく手法の2分法はますます曖昧になっていると我々は主張する。
論文 参考訳(メタデータ) (2025-07-08T11:45:51Z) - Intrinsic Dynamics-Driven Generalizable Scene Representations for Vision-Oriented Decision-Making Applications [0.21051221444478305]
シーン表現の能力をいかに向上させるかは、ビジョン指向の意思決定アプリケーションにおいて重要な問題である。
視覚強化学習におけるシーケンスモデルを用いた固有ダイナミクス駆動表現学習法を提案する。
論文 参考訳(メタデータ) (2024-05-30T06:31:03Z) - Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-09T07:45:26Z) - The Role of Foundation Models in Neuro-Symbolic Learning and Reasoning [54.56905063752427]
Neuro-Symbolic AI(NeSy)は、AIシステムの安全なデプロイを保証することを約束している。
ニューラルネットワークとシンボリックコンポーネントを順次トレーニングする既存のパイプラインは、広範なラベリングを必要とする。
新しいアーキテクチャであるNeSyGPTは、生データから象徴的特徴を抽出する視覚言語基盤モデルを微調整する。
論文 参考訳(メタデータ) (2024-02-02T20:33:14Z) - Symbolic Visual Reinforcement Learning: A Scalable Framework with
Object-Level Abstraction and Differentiable Expression Search [63.3745291252038]
DiffSESは、離散的なシンボルポリシーを発見する新しいシンボリック学習手法である。
生のピクセルレベルの入力の代わりにオブジェクトレベルの抽象化を使用することで、DiffSESはシンボリック表現の単純さとスケーラビリティの利点を活用することができる。
我々の実験は、DiffSESが最先端のシンボルRL法よりもシンプルでスケーラブルなシンボリックポリシーを生成することができることを示した。
論文 参考訳(メタデータ) (2022-12-30T17:50:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。