論文の概要: Behavioral Analysis of Vision-and-Language Navigation Agents
- arxiv url: http://arxiv.org/abs/2307.10790v1
- Date: Thu, 20 Jul 2023 11:42:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-21 13:18:44.860821
- Title: Behavioral Analysis of Vision-and-Language Navigation Agents
- Title(参考訳): 視覚・言語ナビゲーションエージェントの行動解析
- Authors: Zijiao Yang, Arjun Majumdar, Stefan Lee
- Abstract要約: VLN(Vision-and-Language Navigation)エージェントは、周囲に基づいて行動の指示を下すことができる。
本研究では,エージェントの振る舞いを専門知識に基づいて研究する手法を開発した。
- 参考スコア(独自算出の注目度): 21.31684388423088
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To be successful, Vision-and-Language Navigation (VLN) agents must be able to
ground instructions to actions based on their surroundings. In this work, we
develop a methodology to study agent behavior on a skill-specific basis --
examining how well existing agents ground instructions about stopping, turning,
and moving towards specified objects or rooms. Our approach is based on
generating skill-specific interventions and measuring changes in agent
predictions. We present a detailed case study analyzing the behavior of a
recent agent and then compare multiple agents in terms of skill-specific
competency scores. This analysis suggests that biases from training have
lasting effects on agent behavior and that existing models are able to ground
simple referring expressions. Our comparisons between models show that
skill-specific scores correlate with improvements in overall VLN task
performance.
- Abstract(参考訳): 成功させるためには、Vision-and-Language Navigation (VLN) エージェントは周囲に基づいて行動の指示を下す必要がある。
本研究では,既存のエージェントが,特定の物体や部屋の停止,旋回,移動に関する指示をいかにしっかりと下ろすかを調べることによって,エージェントの行動を研究する手法を開発する。
このアプローチはスキル固有の介入の生成とエージェント予測の変化の測定に基づいている。
本稿では,近年のエージェントの行動を分析し,複数のエージェントを比較した詳細なケーススタディを提案する。
この分析は、学習のバイアスがエージェントの挙動に持続的な影響を与え、既存のモデルが単純な参照表現を基礎にすることができることを示唆している。
本モデルとの比較から,VLNタスク全体の性能向上とスキル特化スコアの相関が示唆された。
関連論文リスト
- Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - Watch Every Step! LLM Agent Learning via Iterative Step-Level Process Refinement [50.481380478458945]
反復的なステップレベルプロセスリファインメント(IPR)フレームワークは、エージェントトレーニングを強化するためのステップバイステップのガイダンスを提供する。
3つの複雑なエージェントタスクに関する我々の実験は、我々のフレームワークが様々な強力なベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2024-06-17T03:29:13Z) - What Makes Pre-Trained Visual Representations Successful for Robust
Manipulation? [57.92924256181857]
照明やシーンテクスチャの微妙な変化の下では,操作や制御作業のために設計された視覚表現が必ずしも一般化されないことがわかった。
創発的セグメンテーション能力は,ViTモデルにおける分布外一般化の強い予測因子であることがわかった。
論文 参考訳(メタデータ) (2023-11-03T18:09:08Z) - Task Formulation Matters When Learning Continually: A Case Study in
Visual Question Answering [58.82325933356066]
継続的な学習は、以前の知識を忘れずに、一連のタスクでモデルを漸進的にトレーニングすることを目的としている。
本稿では,視覚的質問応答において,異なる設定がパフォーマンスに与える影響について詳細に検討する。
論文 参考訳(メタデータ) (2022-09-30T19:12:58Z) - Beyond Rewards: a Hierarchical Perspective on Offline Multiagent
Behavioral Analysis [14.656957226255628]
本稿では,マルチエージェント領域における行動クラスタの発見のためのモデルに依存しない手法を提案する。
我々のフレームワークはエージェントの基盤となる学習アルゴリズムを前提とせず、潜伏状態やモデルへのアクセスを必要とせず、完全にオフラインで観察データを使って訓練することができる。
論文 参考訳(メタデータ) (2022-06-17T23:07:33Z) - Differential Assessment of Black-Box AI Agents [29.98710357871698]
従来知られていたモデルから逸脱したブラックボックスAIエージェントを差分評価する手法を提案する。
我々は,漂流エージェントの現在の挙動と初期モデルの知識の疎度な観察を利用して,アクティブなクエリポリシーを生成する。
経験的評価は、エージェントモデルをスクラッチから再学習するよりも、我々のアプローチの方がはるかに効率的であることを示している。
論文 参考訳(メタデータ) (2022-03-24T17:48:58Z) - Explaining Reinforcement Learning Policies through Counterfactual
Trajectories [147.7246109100945]
人間の開発者は、RLエージェントがテスト時にうまく機能することを検証しなければならない。
本手法では, エージェントの挙動をより広い軌道分布で示すことにより, エージェントの挙動を分布変化下で表現する。
本研究では,2つのエージェント検証タスクのうちの1つに対して,ベースライン法よりも優れたスコアを得られることを示す。
論文 参考訳(メタデータ) (2022-01-29T00:52:37Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Domain-independent generation and classification of behavior traces [18.086782548507855]
CABBOT(英語: CABBOT)は、エージェントが行動を観察している種類の計画エージェントのオンライン分類を行うことができる学習技術である。
我々は、有望な結果をもたらすいくつかの(金融と非金融の両方)領域で実験を行う。
論文 参考訳(メタデータ) (2020-11-03T16:58:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。