論文の概要: Learning to Perceive the World Through Control: Empowerment-Based Representation Learning
- arxiv url: http://arxiv.org/abs/2605.30656v1
- Date: Thu, 28 May 2026 23:28:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.289698
- Title: Learning to Perceive the World Through Control: Empowerment-Based Representation Learning
- Title(参考訳): 制御を通して世界を理解するための学習--エンパワーメントに基づく表現学習
- Authors: Mahsa Bastankhah, Sophie Broderick, Benjamin Eysenbach,
- Abstract要約: エンパワーメントは、エージェントが世界の暗黙的なコントロール中心のモデルを学ぶのに役立ちます。
我々の分析は、受動的データセットからではなく、相互作用を通して表現を学習することの重要性を強調している。
- 参考スコア(独自算出の注目度): 26.8155637946433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many practical reinforcement learning environments, observations are far higher-dimensional than the variables that matter for control. In this work, we ask: can we learn representations that capture only control-relevant features of the environment? We study this question through the empowerment objective, which maximizes an agent's influence over the environment and is widely used for unsupervised skill learning. We show that empowerment agents induce two distinct representations -- forward and backward -- that capture complementary aspects of the state, and both of which are invariant to control-irrelevant features. Thus, empowerment maximization leads agents to learn an implicit, control-centric model of the world. Our analysis highlights the importance of learning representations through interaction rather than from passive datasets: interaction aimed at maximizing control is essential for learning useful invariance properties, a perspective that aligns closely with the causal learning literature.
- Abstract(参考訳): 多くの実践的な強化学習環境において、観測は制御に重要な変数よりもはるかに高次元である。
環境の制御関連機能だけをキャプチャする表現を学べますか?
本研究では,エージェントの環境への影響を最大化し,教師なしスキル学習に広く利用されているエンパワーメント目標を用いて,この課題を考察する。
我々は、エンパワーメントエージェントが、状態の相補的な側面をとらえる2つの異なる表現(前方と後方)を誘導し、どちらも制御不能な特徴に不変であることを示す。
このように、エンパワーメントの最大化は、エージェントが世界の暗黙的な制御中心のモデルを学ぶことにつながる。
我々の分析では、受動的データセットからではなく、相互作用を通しての学習表現の重要性を強調している。
関連論文リスト
- Revisiting Multi-Task Visual Representation Learning [52.93947931352643]
本稿では,マルチタスク・ビジュアル事前学習フレームワークであるMTVを紹介する。
我々は、高容量の「エキスパート」モデルを利用して、高密度で構造化された擬似ラベルを大規模に合成する。
以上の結果から,MTV が "Best-of-both-worlds" のパフォーマンスを達成できることが示唆された。
論文 参考訳(メタデータ) (2026-01-20T11:59:19Z) - Can Self-Supervised Representation Learning Methods Withstand
Distribution Shifts and Corruptions? [5.706184197639971]
コンピュータビジョンにおける自己教師付き学習は、データ内の固有の構造と関係を利用して意味のある表現を学ぶことを目的としている。
本研究では,自己指導型学習手法の学習表現のロバスト性について検討し,分布シフトと画像劣化に着目した。
論文 参考訳(メタデータ) (2023-07-31T13:07:56Z) - Vision-Based Manipulators Need to Also See from Their Hands [58.398637422321976]
本研究では,視覚的視点の選択が,生のセンサ観測から身体操作の文脈における学習と一般化にどう影響するかを検討する。
手中心(目の)視点は可観測性を低下させるが、トレーニング効率とアウト・オブ・ディストリビューションの一般化を一貫して改善する。
論文 参考訳(メタデータ) (2022-03-15T18:46:18Z) - Information is Power: Intrinsic Control via Information Capture [110.3143711650806]
我々は,潜時状態空間モデルを用いて推定したエージェントの状態訪問のエントロピーを最小化する,コンパクトで汎用的な学習目的を論じる。
この目的は、不確実性の低減に対応する環境情報収集と、将来の世界状態の予測不可能性の低減に対応する環境制御の両方をエージェントに誘導する。
論文 参考訳(メタデータ) (2021-12-07T18:50:42Z) - Learning to Improve Representations by Communicating About Perspectives [0.0]
本稿では,多数のオートエンコーダからなるミニマルアーキテクチャを提案する。
提案したアーキテクチャは整列表現の出現を許容することを示す。
その結果、主観的パースペクティブからのコミュニケーションが、マルチエージェントシステムにおけるより抽象的な表現の獲得につながることを示す。
論文 参考訳(メタデータ) (2021-09-20T09:30:13Z) - Visual Adversarial Imitation Learning using Variational Models [60.69745540036375]
逆関数仕様は、深い強化学習を通しての学習行動にとって大きな障害であり続けている。
望ましい行動の視覚的なデモンストレーションは、エージェントを教えるためのより簡単で自然な方法を示すことが多い。
変動モデルに基づく対向的模倣学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-07-16T00:15:18Z) - Self-Supervised Learning Across Domains [33.86614301708017]
本稿では,ドメイン間のオブジェクト認識の問題に対して,同様のアプローチを適用することを提案する。
モデルでは,教師付き方式でセマンティックラベルを学習し,同じ画像上の自己教師型信号から学習することで,データに対する理解を深める。
この二次的なタスクは、ネットワークが対象の形状、空間配向や部分相関といった概念を学ぶのに役立ち、分類タスクの正規化として機能する。
論文 参考訳(メタデータ) (2020-07-24T06:19:53Z) - Self-supervised Learning from a Multi-view Perspective [121.63655399591681]
自己教師型表現はタスク関連情報を抽出し,タスク関連情報を破棄することができることを示す。
我々の理論的枠組みは、自己教師型学習目標設計のより広い空間への道を開くものである。
論文 参考訳(メタデータ) (2020-06-10T00:21:35Z) - Mutual Information-based State-Control for Intrinsically Motivated
Reinforcement Learning [102.05692309417047]
強化学習において、エージェントは、外部報酬信号を用いて一連の目標に到達することを学習する。
自然界では、知的生物は内部の駆動から学習し、外部の信号を必要としない。
目的状態と制御可能な状態の間の相互情報として本質的な目的を定式化する。
論文 参考訳(メタデータ) (2020-02-05T19:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。