論文の概要: Neuro-Cognitive Reward Modeling for Human-Centered Autonomous Vehicle Control
- arxiv url: http://arxiv.org/abs/2603.25968v1
- Date: Thu, 26 Mar 2026 23:16:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.311055
- Title: Neuro-Cognitive Reward Modeling for Human-Centered Autonomous Vehicle Control
- Title(参考訳): 人間中心型自律走行車制御のためのニューロ認知リワードモデリング
- Authors: Zhuoli Zhuang, Yu-Cheng Chang, Yu-Kai Wang, Thomas Do, Chin-Teng Lin,
- Abstract要約: 人間は、シーン情報を迅速に解釈し、正確な決定をすることができる洗練された認知システムを持っている。
人間の認知的洞察を組み込むための脳波誘導型意思決定フレームワークを提案する。
我々のフレームワークは強化学習アルゴリズムの衝突回避能力を向上させることができる。
- 参考スコア(独自算出の注目度): 28.311461870546253
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in computer vision have accelerated the development of autonomous driving. Despite these advancements, training machines to drive in a way that aligns with human expectations remains a significant challenge. Human factors are still essential, as humans possess a sophisticated cognitive system capable of rapidly interpreting scene information and making accurate decisions. Aligning machine with human intent has been explored with Reinforcement Learning with Human Feedback (RLHF). Conventional RLHF methods rely on collecting human preference data by manually ranking generated outputs, which is time-consuming and indirect. In this work, we propose an electroencephalography (EEG)-guided decision-making framework to incorporate human cognitive insights without behaviour response interruption into reinforcement learning (RL) for autonomous driving. We collected EEG signals from 20 participants in a realistic driving simulator and analyzed event-related potentials (ERP) in response to sudden environmental changes. Our proposed framework employs a neural network to predict the strength of ERP based on the cognitive information from visual scene information. Moreover, we explore the integration of such cognitive information into the reward signal of the RL algorithm. Experimental results show that our framework can improve the collision avoidance ability of the RL algorithm, highlighting the potential of neuro-cognitive feedback in enhancing autonomous driving systems. Our project page is: https://alex95gogo.github.io/Cognitive-Reward/.
- Abstract(参考訳): コンピュータビジョンの最近の進歩は、自動運転の開発を加速させた。
これらの進歩にもかかわらず、人間の期待に沿う方法で運転するトレーニングマシンは、依然として大きな課題である。
人間は、シーン情報を迅速に解釈し、正確な決定をすることができる洗練された認知システムを持っているため、人間の要因は依然として不可欠である。
Reinforcement Learning with Human Feedback (RLHF) を用いて, 人間の意図による機械の調整について検討した。
従来のRLHF法は、時間を要する間接的な出力を手作業でランク付けすることで、人間の嗜好データを収集することに依存している。
本研究では、自律運転のための強化学習(RL)に行動応答を中断せずに人間の認知的洞察を組み込むための脳波誘導意思決定フレームワークを提案する。
現実的な運転シミュレーターの被験者20名から脳波信号を収集し,突然の環境変化に応じて事象関連電位(ERP)を解析した。
提案フレームワークは,視覚的シーン情報から認知情報に基づいてERPの強度を予測するニューラルネットワークを用いる。
さらに,そのような認知情報のRLアルゴリズムの報奨信号への統合について検討する。
実験の結果,RLアルゴリズムの衝突回避能力は向上し,自律運転システムの強化における神経認知フィードバックの可能性を強調した。
私たちのプロジェクトページは以下のとおりです。
関連論文リスト
- Driver-Intention Prediction with Deep Learning: Real-Time Brain-to-Vehicle Communication [2.7998963147546143]
本研究では,脳波(EEG)信号を用いた運転者のハンドル操作意図の予測手法を提案する。
運転シミュレーターは、参加者が様々な運転シナリオで車両を制御することを想像する制御環境を作った。
畳み込みニューラルネットワーク(CNN)は、検出された脳波データを最小の事前処理で分類した。
論文 参考訳(メタデータ) (2026-01-08T16:29:08Z) - Mapping Neural Signals to Agent Performance, A Step Towards Reinforcement Learning from Neural Feedback [2.9060647847644985]
NEURO-LOOPは、人間とエージェントの相互作用を促進するために、本質的な人間報酬システムを利用する暗黙のフィードバックフレームワークである。
この研究は、NEURO-LOOPフレームワークにおける重要な第一歩である脳信号をエージェントのパフォーマンスにマッピングする可能性を示している。
従来の機械学習手法を用いて,fNIRSデータとエージェント性能の関係を検証した。
論文 参考訳(メタデータ) (2025-06-14T21:38:31Z) - Neural Brain: A Neuroscience-inspired Framework for Embodied Agents [78.61382193420914]
大規模な言語モデルのような現在のAIシステムは、いまだに解体され続けており、物理的に世界と関わりが持てない。
この課題の核心は、人間のような適応性を持つエンボディエージェントを駆動するために設計された中枢知能システムであるNeural Brain(ニューラル・ブレイン)の概念である。
本稿では,2つの基本的な課題に対処する,エンボディエージェントのニューラルブレインの統一的枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-12T15:05:34Z) - Siamese Network with Dual Attention for EEG-Driven Social Learning: Bridging the Human-Robot Gap in Long-Tail Autonomous Driving [0.0]
本研究では脳波信号の分類を行う脳-コンピュータインタフェース(BCI)フレームワークを提案する。
タイムリーかつモチベーションの高いコロボティックエンジニアリングアプリケーションとして、準自律ロボット運転における危険事象を警告するために、人間とループのシナリオをシミュレートする。
本稿では,脳波を符号化した信号表現を生成するために,ダイナミック・タイム・ワーピング・バリーセンタ平均化手法と組み合わせた二重アテンション・シームズ畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2025-04-14T15:06:17Z) - Shifting Attention to You: Personalized Brain-Inspired AI Models [3.0128071072792366]
人間の行動洞察とミリ秒スケールのニューラルネットワークを微調整CLIPベースモデルに統合することで、修正されていないCLIPベースラインと比較して、行動性能が2倍になることを示す。
我々の研究は、適応型AIシステムを設計するための、新しい解釈可能なフレームワークを確立し、神経科学、パーソナライズドメディカル、人間とコンピュータの相互作用に幅広い意味を持つ。
論文 参考訳(メタデータ) (2025-02-07T04:55:31Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Neurosymbolic hybrid approach to driver collision warning [64.02492460600905]
自律運転システムには2つの主要なアルゴリズムアプローチがある。
ディープラーニングだけでは、多くの分野で最先端の結果が得られています。
しかし、ディープラーニングモデルが機能しない場合、デバッグが非常に難しい場合もあります。
論文 参考訳(メタデータ) (2022-03-28T20:29:50Z) - Brain-Inspired Deep Imitation Learning for Autonomous Driving Systems [0.38673630752805443]
ヒトは、脳の両側の構造的および機能的非対称性から恩恵を受ける強力な一般化能力を持つ。
そこで我々は,人間のニューラルネットワークの非対称性に基づいて,ディープニューラルネットワークにおけるデュアルニューラルネットワークポリシー(NCP)アーキテクチャを設計する。
実験の結果,脳にインスパイアされた手法は,見えないデータを扱う場合の一般化に関する既存の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-30T14:21:46Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Improving Robustness of Learning-based Autonomous Steering Using
Adversarial Images [58.287120077778205]
自動運転用画像入力における学習アルゴリズムw.r.tの堅牢性を解析するためのフレームワークについて紹介する。
感度分析の結果を用いて, 「操縦への学習」 タスクの総合的性能を向上させるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-26T02:08:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。