論文の概要: Active Altruism Learning and Information Sufficiency for Autonomous
Driving
- arxiv url: http://arxiv.org/abs/2110.04580v1
- Date: Sat, 9 Oct 2021 14:36:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-16 23:01:53.061434
- Title: Active Altruism Learning and Information Sufficiency for Autonomous
Driving
- Title(参考訳): 自律運転のためのアクティブ利他学習と情報不足
- Authors: Jack Geary, Henry Gouk, Subramanian Ramamoorthy
- Abstract要約: 我々は、自動運転車が、他の車両の利他的傾斜に関する情報を明らかにする行動を選択するために、どのようにインセンティブを与えるかを示す。
本稿では,情報十分性を持つ報酬定義を提案し,利他的傾向を推定するために探索行動を選択するAVを容易にすることを示す。
- 参考スコア(独自算出の注目度): 9.475039534437332
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Safe interaction between vehicles requires the ability to choose actions that
reveal the preferences of the other vehicles. Since exploratory actions often
do not directly contribute to their objective, an interactive vehicle must also
able to identify when it is appropriate to perform them. In this work we
demonstrate how Active Learning methods can be used to incentivise an
autonomous vehicle (AV) to choose actions that reveal information about the
altruistic inclinations of another vehicle. We identify a property, Information
Sufficiency, that a reward function should have in order to keep exploration
from unnecessarily interfering with the pursuit of an objective. We empirically
demonstrate that reward functions that do not have Information Sufficiency are
prone to inadequate exploration, which can result in sub-optimal behaviour. We
propose a reward definition that has Information Sufficiency, and show that it
facilitates an AV choosing exploratory actions to estimate altruistic tendency,
whilst also compensating for the possibility of conflicting beliefs between
vehicles.
- Abstract(参考訳): 車両間の安全な相互作用には、他の車両の好みを明らかにする行動を選択する能力が必要である。
探索行動は目的に直接寄与しないことが多いため、インタラクティブな車両は、その実行に適したタイミングを識別することも可能だ。
本研究では,自律走行車両(av)にインセンティブを与えるアクティブ学習手法を用いて,他車両の利他的インクリメントに関する情報を明らかにする行動を選択できることを実証する。
我々は、目的の追求に不必要に干渉しないように、報酬関数が持つべき資産である情報十分性を特定する。
我々は,情報不足を伴わない報酬関数が不適切な探索を行いやすいことを実証的に示す。
情報充実度を有する報酬定義を提案し,利他的傾向を推定する探索的行動をavが選択し,車両間の矛盾する信念の可能性を補うことができることを示す。
関連論文リスト
- Effects of Multimodal Explanations for Autonomous Driving on Driving Performance, Cognitive Load, Expertise, Confidence, and Trust [2.9143343479274675]
我々は、AIコーチの説明コミュニケーションが、パフォーマンス駆動専門家の指示をモデルにした影響を検証した。
結果として、AIコーチングは、初心者にパフォーマンス駆動スキルを効果的に教えることができることを示している。
効率的なHMI通信を設計する際には,効率的なモダリティに適した説明を選択すべきである。
論文 参考訳(メタデータ) (2024-01-08T19:33:57Z) - DRUformer: Enhancing the driving scene Important object detection with
driving relationship self-understanding [50.81809690183755]
交通事故はしばしば致命傷を負い、2023年まで5000万人以上の死者を出した。
従来の研究は、主に個々の参加者の重要性を評価し、それらを独立した存在として扱うものであった。
本稿では、重要な物体検出タスクを強化するために、運転シーン関連自己理解変換器(DRUformer)を紹介する。
論文 参考訳(メタデータ) (2023-11-11T07:26:47Z) - PONI: Potential Functions for ObjectGoal Navigation with
Interaction-free Learning [125.22462763376993]
対話自由学習(PONI)を用いたオブジェクト指向ナビゲーションの可能性について提案する。
PONIは、物がどこに見えるかというスキルと、どのように(x, y)にナビゲートするかを歪めます。」
論文 参考訳(メタデータ) (2022-01-25T01:07:32Z) - Learning to Navigate Intersections with Unsupervised Driver Trait
Inference [2.9048924265579124]
観測車両軌道から運転スタイルなどの運転特性を推定するための教師なし手法を提案する。
我々は、リカレントニューラルネットワークを用いた変分オートエンコーダを用いて、基礎となる真理特性ラベルを使わずに、特性の潜在表現を学習する。
当社のパイプラインは、異なる特徴を持つドライバーに安全と効率を確保するために、自動運転車が行動を調整することを可能にする。
論文 参考訳(メタデータ) (2021-09-14T15:54:35Z) - Learning by Watching [7.785051236155595]
観察による学習(LbW)は、国家や専門家の行動の知識を必要とせず、運転方針を学習することができる。
LbWは、エゴ車両の観察を視界に変換することで、あるシーンにおける他の車両のデモンストレーションを利用する。
我々のLbWエージェントは、データ効率のよい学習を可能にしながら、より堅牢な運転ポリシーを学びます。
論文 参考訳(メタデータ) (2021-06-10T17:58:34Z) - Vehicular Cooperative Perception Through Action Branching and Federated
Reinforcement Learning [101.64598586454571]
強化学習に基づく車両関連、リソースブロック(RB)割り当て、協調認識メッセージ(CPM)のコンテンツ選択を可能にする新しいフレームワークが提案されている。
車両全体のトレーニングプロセスをスピードアップするために、フェデレーションRLアプローチが導入されます。
その結果、フェデレーションRLはトレーニングプロセスを改善し、非フェデレーションアプローチと同じ時間内により良いポリシーを達成できることが示された。
論文 参考訳(メタデータ) (2020-12-07T02:09:15Z) - Studying Person-Specific Pointing and Gaze Behavior for Multimodal
Referencing of Outside Objects from a Moving Vehicle [58.720142291102135]
物体選択と参照のための自動車応用において、手指しと目視が広く研究されている。
既存の車外参照手法は静的な状況に重点を置いているが、移動車両の状況は極めて動的であり、安全性に制約がある。
本研究では,外部オブジェクトを参照するタスクにおいて,各モダリティの具体的特徴とそれら間の相互作用について検討する。
論文 参考訳(メタデータ) (2020-09-23T14:56:19Z) - Road obstacles positional and dynamic features extraction combining
object detection, stereo disparity maps and optical flow data [0.0]
ナビゲーション目的の視覚認識システムが障害を特定することは重要である。
本稿では,障害物の同定とクラス,位置,深さ,動き情報の抽出について述べる。
論文 参考訳(メタデータ) (2020-06-24T19:29:06Z) - Intrinsic Motivation for Encouraging Synergistic Behavior [55.10275467562764]
スパース・リワード・シナジスティック・タスクにおける強化学習の探索バイアスとしての本質的モチベーションの役割について検討した。
私たちのキーとなる考え方は、シナジスティックなタスクにおける本質的なモチベーションのための優れた指針は、エージェントが自分自身で行動している場合、達成できない方法で世界に影響を与える行動を取ることである。
論文 参考訳(メタデータ) (2020-02-12T19:34:51Z) - Mutual Information-based State-Control for Intrinsically Motivated
Reinforcement Learning [102.05692309417047]
強化学習において、エージェントは、外部報酬信号を用いて一連の目標に到達することを学習する。
自然界では、知的生物は内部の駆動から学習し、外部の信号を必要としない。
目的状態と制御可能な状態の間の相互情報として本質的な目的を定式化する。
論文 参考訳(メタデータ) (2020-02-05T19:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。