論文の概要: Human-AI Collaboration in Real-World Complex Environment with
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2312.15160v1
- Date: Sat, 23 Dec 2023 04:27:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 19:23:21.108307
- Title: Human-AI Collaboration in Real-World Complex Environment with
Reinforcement Learning
- Title(参考訳): 強化学習を用いた実世界複合環境におけるヒューマン・aiコラボレーション
- Authors: Md Saiful Islam, Srijita Das, Sai Krishna Gottipati, William Duguay,
Clod\'eric Mars, Jalal Arabneydi, Antoine Fagette, Matthew Guzdial,
Matthew-E-Taylor
- Abstract要約: 人間からの学習は効果的であり、人間とAIのコラボレーションは、人間の制御された完全に自律的なAIエージェントよりも優れていることを示す。
我々は,AIエージェントを効果的に支援するためのユーザインタフェースを開発した。
- 参考スコア(独自算出の注目度): 8.465957423148657
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in reinforcement learning (RL) and Human-in-the-Loop (HitL)
learning have made human-AI collaboration easier for humans to team with AI
agents. Leveraging human expertise and experience with AI in intelligent
systems can be efficient and beneficial. Still, it is unclear to what extent
human-AI collaboration will be successful, and how such teaming performs
compared to humans or AI agents only. In this work, we show that learning from
humans is effective and that human-AI collaboration outperforms
human-controlled and fully autonomous AI agents in a complex simulation
environment. In addition, we have developed a new simulator for critical
infrastructure protection, focusing on a scenario where AI-powered drones and
human teams collaborate to defend an airport against enemy drone attacks. We
develop a user interface to allow humans to assist AI agents effectively. We
demonstrated that agents learn faster while learning from policy correction
compared to learning from humans or agents. Furthermore, human-AI collaboration
requires lower mental and temporal demands, reduces human effort, and yields
higher performance than if humans directly controlled all agents. In
conclusion, we show that humans can provide helpful advice to the RL agents,
allowing them to improve learning in a multi-agent setting.
- Abstract(参考訳): 近年の強化学習(RL)とHitL(Human-in-the-Loop)の学習は、人間とAIのコラボレーションを容易にし、AIエージェントと連携できるようにしている。
インテリジェントシステムにおける人間の専門知識とAIの経験を活用することは効率的かつ有益である。
それでも、人間とAIのコラボレーションがどの程度成功するのか、そのようなコラボレーションが人間やAIエージェントに比較してどのように実行されるのかは不明だ。
本研究では、人間からの学習が効果的であり、複雑なシミュレーション環境において、人間とAIのコラボレーションが人間制御された完全自律型AIエージェントより優れていることを示す。
さらに,我々は,aiを活用したドローンと人間チームが協力して空港を敵のドローン攻撃から守るシナリオに焦点を当てた,重要なインフラストラクチャ保護のための新しいシミュレータを開発した。
我々は,AIエージェントを効果的に支援するためのユーザインタフェースを開発した。
人間やエージェントの学習と比較して,政策修正から学習しながらエージェントがより早く学習できることを実証した。
さらに、人間とAIの協力は、精神的および時間的要求を低くし、人間の努力を減らし、人間が直接すべてのエージェントを制御した場合よりも高いパフォーマンスを得る。
結論として、人間はRLエージェントに有益なアドバイスを提供し、マルチエージェント環境での学習を改善することができることを示す。
関連論文リスト
- CREW: Facilitating Human-AI Teaming Research [3.7324091969140776]
我々は、人間とAIのコラボレーション研究を促進するプラットフォームCREWを紹介し、複数の科学分野から協力する。
これには、認知研究のための事前構築されたタスクや、モジュール設計から拡張可能なポテンシャルを備えたヒューマンAIコラボレーションが含まれます。
CREWは、最先端のアルゴリズムとよく訓練されたベースラインを使用して、リアルタイムの人間誘導型強化学習エージェントをベンチマークする。
論文 参考訳(メタデータ) (2024-07-31T21:43:55Z) - On the Utility of Accounting for Human Beliefs about AI Intention in Human-AI Collaboration [9.371527955300323]
我々は、人間がどのように解釈し、AIパートナーの意図を判断するかを捉える人間の信念のモデルを開発する。
私たちは、人間と対話するための戦略を考案する際に、人間の行動と人間の信念の両方を取り入れたAIエージェントを作成します。
論文 参考訳(メタデータ) (2024-06-10T06:39:37Z) - When combinations of humans and AI are useful: A systematic review and meta-analysis [0.0]
我々は300以上の効果サイズを報告した100以上の最近の研究のメタ分析を行った。
平均して、人間とAIの組み合わせは、人間とAI単独のベストよりもはるかに悪い結果が得られた。
論文 参考訳(メタデータ) (2024-05-09T20:23:15Z) - Applying HCAI in developing effective human-AI teaming: A perspective
from human-AI joint cognitive systems [10.746728034149989]
研究と応用は、AIシステムを開発するための新しいパラダイムとして、HAT(Human-AI Teaming)を使用している。
我々は,人間とAIの協調認知システム(HAIJCS)の概念的枠組みについて詳しく検討する。
本稿では,HATを表現・実装するためのヒューマンAI共同認知システム(HAIJCS)の概念的枠組みを提案する。
論文 参考訳(メタデータ) (2023-07-08T06:26:38Z) - BO-Muse: A human expert and AI teaming framework for accelerated
experimental design [58.61002520273518]
我々のアルゴリズムは、人間の専門家が実験プロセスでリードすることを可能にする。
我々のアルゴリズムは、AIや人間よりも高速に、サブ線形に収束することを示す。
論文 参考訳(メタデータ) (2023-03-03T02:56:05Z) - Human Decision Makings on Curriculum Reinforcement Learning with
Difficulty Adjustment [52.07473934146584]
我々は,カリキュラム強化学習結果を,人的意思決定プロセスから学ぶことで,難しすぎず,難しすぎるような望ましいパフォーマンスレベルに導く。
本システムは非常に並列化可能であり,大規模強化学習アプリケーションの訓練が可能となる。
強化学習性能は、人間の所望の難易度と同期してうまく調整できることが示される。
論文 参考訳(メタデータ) (2022-08-04T23:53:51Z) - Trustworthy AI: A Computational Perspective [54.80482955088197]
我々は,信頼に値するAIを実現する上で最も重要な6つの要素,(i)安全とロバスト性,(ii)非差別と公正,(iii)説明可能性,(iv)プライバシー,(v)説明可能性と監査性,(vi)環境ウェルビーイングに焦点をあてる。
各次元について、分類学に基づく最近の関連技術について概観し、実世界のシステムにおけるそれらの応用を概説する。
論文 参考訳(メタデータ) (2021-07-12T14:21:46Z) - Artificial Intelligence & Cooperation [38.19500588776648]
人工知能の台頭は、マシンへの意思決定を断念する、ますます増加する意欲をもたらすだろう。
しかし、機械に私たちに影響を与える決定権を与えるのではなく、AIシステムと協調して働く方法が必要だ。
成功すれば、人間とAIの協力は、人間と人間の協力と同じように社会を構築することができる。
論文 参考訳(メタデータ) (2020-12-10T23:54:31Z) - Watch-And-Help: A Challenge for Social Perception and Human-AI
Collaboration [116.28433607265573]
我々は、AIエージェントでソーシャルインテリジェンスをテストするための課題であるWatch-And-Help(WAH)を紹介する。
WAHでは、AIエージェントは、人間のようなエージェントが複雑な家庭用タスクを効率的に実行するのを助ける必要がある。
マルチエージェントの家庭環境であるVirtualHome-Socialを構築し、計画と学習ベースのベースラインを含むベンチマークを提供する。
論文 参考訳(メタデータ) (2020-10-19T21:48:31Z) - Learning to Complement Humans [67.38348247794949]
オープンワールドにおけるAIに対するビジョンの高まりは、知覚、診断、推論タスクのために人間を補完できるシステムの開発に焦点を当てている。
我々は,人間-機械チームの複合的なパフォーマンスを最適化するために,エンド・ツー・エンドの学習戦略をどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2020-05-01T20:00:23Z) - Is the Most Accurate AI the Best Teammate? Optimizing AI for Teamwork [54.309495231017344]
AIシステムは人間中心の方法でトレーニングされ、チームのパフォーマンスに直接最適化されるべきである、と私たちは主張する。
我々は,AIレコメンデーションを受け入れるか,あるいはタスク自体を解決するかを選択する,特定のタイプのAIチームを提案する。
実世界の高精度データセット上での線形モデルと非線形モデルによる実験は、AIが最も正確であることは、最高のチームパフォーマンスに繋がらないことを示している。
論文 参考訳(メタデータ) (2020-04-27T19:06:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。