論文の概要: Probing Emergent Semantics in Predictive Agents via Question Answering
- arxiv url: http://arxiv.org/abs/2006.01016v1
- Date: Mon, 1 Jun 2020 15:27:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 05:46:48.787006
- Title: Probing Emergent Semantics in Predictive Agents via Question Answering
- Title(参考訳): 質問応答による予測エージェントの創発的セマンティクスの探索
- Authors: Abhishek Das, Federico Carnevale, Hamza Merzic, Laura Rimell, Rosalia
Schneider, Josh Abramson, Alden Hung, Arun Ahuja, Stephen Clark, Gregory
Wayne, Felix Hill
- Abstract要約: 近年の研究では、予測モデリングがエージェントに周囲の知識を豊富に与え、複雑な環境での行動能力を向上させる方法が示されている。
本稿では,そのようなエージェントがモデルを開発する表現をデコードし,理解するための一般的なパラダイムとして,質問応答を提案する。
質問応答デコーダからエージェントへの勾配をバックプロパゲートすることなく、それらの内部状態表現を合成的(英語)質問で探索する。
- 参考スコア(独自算出の注目度): 29.123837711842995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work has shown how predictive modeling can endow agents with rich
knowledge of their surroundings, improving their ability to act in complex
environments. We propose question-answering as a general paradigm to decode and
understand the representations that such agents develop, applying our method to
two recent approaches to predictive modeling -action-conditional CPC (Guo et
al., 2018) and SimCore (Gregor et al., 2019). After training agents with these
predictive objectives in a visually-rich, 3D environment with an assortment of
objects, colors, shapes, and spatial configurations, we probe their internal
state representations with synthetic (English) questions, without
backpropagating gradients from the question-answering decoder into the agent.
The performance of different agents when probed this way reveals that they
learn to encode factual, and seemingly compositional, information about
objects, properties and spatial relations from their physical environment. Our
approach is intuitive, i.e. humans can easily interpret responses of the model
as opposed to inspecting continuous vectors, and model-agnostic, i.e.
applicable to any modeling approach. By revealing the implicit knowledge of
objects, quantities, properties and relations acquired by agents as they learn,
question-conditional agent probing can stimulate the design and development of
stronger predictive learning objectives.
- Abstract(参考訳): 近年の研究では、予測モデリングがエージェントに環境に関する豊富な知識を与え、複雑な環境で振る舞う能力を改善する方法が示されている。
我々は,これらのエージェントが生み出す表現をデコードし理解するための一般的なパラダイムとして,我々の手法を2つの最近の予測モデル-行動条件CPC(Guo et al., 2018)とSimCore(Gregor et al., 2019)に適用する。
対象物,色,形状,空間的構成を揃えた視覚豊かな3次元環境において,これらの予測対象を持つエージェントを訓練した後,質問応答デコーダからエージェントへの勾配を逆伝播することなく,内部状態表現を合成(英語)質問で探索する。
このように調査された異なるエージェントのパフォーマンスは、物理的環境からオブジェクト、特性、空間的関係に関する情報を、事実的かつ一見構成的にエンコードすることを学ぶことを明らかにしている。
我々のアプローチは直感的であり、つまり、連続ベクトルの検査とは対照的に、人間がモデルの応答を容易に解釈でき、モデルに依存しない、すなわちあらゆるモデリングアプローチに適用できる。
エージェントが学習する対象、量、特性、関係の暗黙の知識を明らかにすることで、より強力な予測学習目標の設計と開発を促進することができる。
関連論文リスト
- Evaluating the Utility of Model Explanations for Model Development [54.23538543168767]
機械学習モデル構築の実践シナリオにおいて、説明が人間の意思決定を改善するかどうかを評価する。
驚いたことに、サリエンシマップが提供されたとき、タスクが大幅に改善されたという証拠は見つからなかった。
以上の結果から,サリエンシに基づく説明における誤解の可能性と有用性について注意が必要であることが示唆された。
論文 参考訳(メタデータ) (2023-12-10T23:13:23Z) - Understanding Your Agent: Leveraging Large Language Models for Behavior
Explanation [7.647395374489533]
本研究では,状態や行動の観察のみに基づいて,エージェントの行動に関する自然言語説明を生成する手法を提案する。
提案手法は,人間ドメインの専門家が作成したものと同じくらい役立つ説明を生成する。
論文 参考訳(メタデータ) (2023-11-29T20:16:23Z) - Explaining Agent Behavior with Large Language Models [7.128139268426959]
本研究では,状態や行動の観察のみに基づいて,エージェントの行動に関する自然言語説明を生成する手法を提案する。
エージェントの振る舞いのコンパクトな表現がいかに学習され、妥当な説明を生み出すかを示す。
論文 参考訳(メタデータ) (2023-09-19T06:13:24Z) - Knowledge-based Reasoning and Learning under Partial Observability in Ad
Hoc Teamwork [4.454557728745761]
本稿では,非単調な論理的推論に基づいてアドホックエージェントの動作を決定するアーキテクチャを提案する。
これは、他のエージェントの行動を予測するモデルのオンライン選択、適応、学習をサポートする。
単純なシナリオと複雑なシナリオの両方において、アーキテクチャのパフォーマンスが、最先端のデータ駆動ベースラインと同等か、あるいは同等であることを示す。
論文 参考訳(メタデータ) (2023-06-01T15:21:27Z) - Planning for Learning Object Properties [117.27898922118946]
我々は、物体特性を象徴的な計画問題として認識するために、ニューラルネットワークを自動的に訓練する問題を定式化する。
トレーニングデータセット作成と学習プロセスを自動化するための戦略を作成するために,計画手法を使用します。
シミュレーションと実環境の両方で実験的な評価を行う。
論文 参考訳(メタデータ) (2023-01-15T09:37:55Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Information is Power: Intrinsic Control via Information Capture [110.3143711650806]
我々は,潜時状態空間モデルを用いて推定したエージェントの状態訪問のエントロピーを最小化する,コンパクトで汎用的な学習目的を論じる。
この目的は、不確実性の低減に対応する環境情報収集と、将来の世界状態の予測不可能性の低減に対応する環境制御の両方をエージェントに誘導する。
論文 参考訳(メタデータ) (2021-12-07T18:50:42Z) - Modelling Behaviour Change using Cognitive Agent Simulations [0.0]
本稿では, シミュレーションエージェントに選択された行動変化理論を適用するために, プログレッシブ・イン・プログレッシブ・リサーチを提案する。
この研究は、不適切な状況下での自己決定的目標達成に必要な複雑なエージェントアーキテクチャに焦点を当てている。
論文 参考訳(メタデータ) (2021-10-16T19:19:08Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - CausalCity: Complex Simulations with Agency for Causal Discovery and
Reasoning [68.74447489372037]
本稿では,因果探索と反事実推論のためのアルゴリズムの開発を目的とした,高忠実度シミュレーション環境を提案する。
私たちの作業の中核となるコンポーネントは、複雑なシナリオを定義して作成することが簡単になるような、テキストの緊急性を導入することです。
我々は3つの最先端の手法による実験を行い、ベースラインを作成し、この環境の可利用性を強調する。
論文 参考訳(メタデータ) (2021-06-25T00:21:41Z) - Learning intuitive physics and one-shot imitation using
state-action-prediction self-organizing maps [0.0]
人間は探索と模倣によって学び、世界の因果モデルを構築し、両方を使って新しいタスクを柔軟に解決する。
このような特徴を生み出す単純だが効果的な教師なしモデルを提案する。
エージェントがアクティブな推論スタイルで柔軟に解決する、複数の関連するが異なる1ショットの模倣タスクに対して、その性能を示す。
論文 参考訳(メタデータ) (2020-07-03T12:29:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。