論文の概要: Shared Autonomy with IDA: Interventional Diffusion Assistance
- arxiv url: http://arxiv.org/abs/2409.15317v1
- Date: Thu, 5 Sep 2024 17:19:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 20:05:48.750307
- Title: Shared Autonomy with IDA: Interventional Diffusion Assistance
- Title(参考訳): IDAと共有自律性: インターベンショナル拡散支援
- Authors: Brandon J. McMahan, Zhenghao Peng, Bolei Zhou, Jonathan C. Kao,
- Abstract要約: 共有自律(SA)は、人間のパイロットとAIの協力者からの入力を組み合わせることで制御を容易にする。
以前のSA研究では、副操縦士は各段階の動作を決定するために常に活発である。
我々は,コピロの行動の期待値が人間の行動のそれを超える場合にのみ,コピロの介入によって制御を動的に共有する,目標に依存しない介入支援(IA)を開発する。
- 参考スコア(独自算出の注目度): 41.62838658851348
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid development of artificial intelligence (AI) has unearthed the potential to assist humans in controlling advanced technologies. Shared autonomy (SA) facilitates control by combining inputs from a human pilot and an AI copilot. In prior SA studies, the copilot is constantly active in determining the action played at each time step. This limits human autonomy and may have deleterious effects on performance. In general, the amount of helpful copilot assistance can vary greatly depending on the task dynamics. We therefore hypothesize that human autonomy and SA performance improve through dynamic and selective copilot intervention. To address this, we develop a goal-agnostic intervention assistance (IA) that dynamically shares control by having the copilot intervene only when the expected value of the copilot's action exceeds that of the human's action across all possible goals. We implement IA with a diffusion copilot (termed IDA) trained on expert demonstrations with goal masking. We prove a lower bound on the performance of IA that depends on pilot and copilot performance. Experiments with simulated human pilots show that IDA achieves higher performance than pilot-only and traditional SA control in variants of the Reacher environment and Lunar Lander. We then demonstrate that IDA achieves better control in Lunar Lander with human-in-the-loop experiments. Human participants report greater autonomy with IDA and prefer IDA over pilot-only and traditional SA control. We attribute the success of IDA to preserving human autonomy while simultaneously offering assistance to prevent the human pilot from entering universally bad states.
- Abstract(参考訳): 人工知能(AI)の急速な発展は、人間が高度な技術を制御するのを助ける可能性を発掘した。
共有自律(SA)は、人間のパイロットとAIの協力者からの入力を組み合わせることで制御を容易にする。
以前のSA研究では、副操縦士は各段階の動作を決定するために常に活発である。
これは人間の自律性を制限し、パフォーマンスに有害な影響を及ぼす可能性がある。
一般に,協調作業支援の量はタスクのダイナミクスによって大きく異なる。
そこで我々は,人間の自律性とSA性能は動的かつ選択的協調的介入によって向上する,という仮説を立てた。
そこで我々は,コピロの行動の期待値がすべての可能な目標にわたって人間の行動のそれを超える場合にのみ,コピロを介在させることによって動的に制御を共有する,目標に依存しない介入支援(IA)を開発する。
我々は,目標マスキングによる専門家による実演を訓練した拡散コーピロット(IDA)を用いてIAを実装した。
パイロットと副操縦士のパフォーマンスに依存するIAの性能に低い限界があることを実証する。
シミュレーションされた人間のパイロットによる実験では、IDAはリーチャー環境とルナーランダーの変種において、パイロットのみのSA制御と従来のSA制御よりも高い性能を達成している。
次に、IDAがLunar Landerにおいて、Human-in-the-loop実験によりより良い制御を実現することを実証する。
人間の参加者は、IDAによりより自律性が向上し、パイロットオンリーのSAコントロールよりもIDAの方が好ましいと報告する。
IDAの成功は、人間の自律性を維持すると同時に、人間のパイロットが普遍的に悪い状態に入るのを防ぐ支援を提供することにある。
関連論文リスト
- Combating Spatial Disorientation in a Dynamic Self-Stabilization Task Using AI Assistants [5.42300240053097]
空間的不整合は、致命的な航空機事故の主要な原因である。
本稿では、パイロットがバランスを維持し、回収不能な制御損失を防止できるAIエージェントの可能性について検討する。
論文 参考訳(メタデータ) (2024-09-09T21:06:22Z) - Work-in-Progress: Crash Course: Can (Under Attack) Autonomous Driving Beat Human Drivers? [60.51287814584477]
本稿では,現在のAVの状況を調べることによって,自律運転における本質的なリスクを評価する。
AVの利点と、現実のシナリオにおける潜在的なセキュリティ課題との微妙なバランスを強調した、特定のクレームを開発する。
論文 参考訳(メタデータ) (2024-05-14T09:42:21Z) - Human-AI Collaboration in Real-World Complex Environment with
Reinforcement Learning [8.465957423148657]
人間からの学習は効果的であり、人間とAIのコラボレーションは、人間の制御された完全に自律的なAIエージェントよりも優れていることを示す。
我々は,AIエージェントを効果的に支援するためのユーザインタフェースを開発した。
論文 参考訳(メタデータ) (2023-12-23T04:27:24Z) - Multi-model fusion for Aerial Vision and Dialog Navigation based on
human attention aids [69.98258892165767]
本稿では,2023年ICCV会話史のための航空航法課題について述べる。
本稿では,人間注意支援型トランスフォーマモデル(HAA-Transformer)と人間注意支援型LSTMモデル(HAA-LSTM)の融合訓練方法を提案する。
論文 参考訳(メタデータ) (2023-08-27T10:32:52Z) - Human Decision Makings on Curriculum Reinforcement Learning with
Difficulty Adjustment [52.07473934146584]
我々は,カリキュラム強化学習結果を,人的意思決定プロセスから学ぶことで,難しすぎず,難しすぎるような望ましいパフォーマンスレベルに導く。
本システムは非常に並列化可能であり,大規模強化学習アプリケーションの訓練が可能となる。
強化学習性能は、人間の所望の難易度と同期してうまく調整できることが示される。
論文 参考訳(メタデータ) (2022-08-04T23:53:51Z) - Autonomous Aerial Robot for High-Speed Search and Intercept Applications [86.72321289033562]
高速物体把握のための完全自律飛行ロボットが提案されている。
追加のサブタスクとして、我々のシステムは、表面に近い極にある気球を自律的にピアスすることができる。
我々のアプローチは、挑戦的な国際競争で検証され、優れた結果が得られました。
論文 参考訳(メタデータ) (2021-12-10T11:49:51Z) - Regulating human control over autonomous systems [1.2691047660244335]
より自律的なシステムの利用は、人間のコントロールの方針によって誘導されるべきである、と論じられている。
本稿では、米国における防衛と輸送の2つの領域における人的制御の概念について考察する。
論文 参考訳(メタデータ) (2020-07-22T06:05:41Z) - AvE: Assistance via Empowerment [77.08882807208461]
そこで我々は,人間の環境制御能力を高めることで,支援のための新しいパラダイムを提案する。
このタスクに依存しない目的は、個人の自律性と最終的な状態を達成する能力を維持する。
論文 参考訳(メタデータ) (2020-06-26T04:40:11Z) - Learning to Optimize Autonomy in Competence-Aware Systems [32.3596917475882]
体験を通して学習し、オンラインで更新する自律の内省モデルを提案する。
我々は、さまざまなレベルの自律性と利用可能な人間のフィードバックにおいて、自身の習熟度を明示的にモデル化する能力認識システム(CAS)を定義する。
我々はCASの収束特性を解析し、ロボット配送と自律運転領域の実験結果を提供する。
論文 参考訳(メタデータ) (2020-03-17T14:31:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。