論文の概要: Analytic Manifold Learning: Unifying and Evaluating Representations for
Continuous Control
- arxiv url: http://arxiv.org/abs/2006.08718v2
- Date: Tue, 6 Oct 2020 19:43:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 04:01:06.543475
- Title: Analytic Manifold Learning: Unifying and Evaluating Representations for
Continuous Control
- Title(参考訳): 解析多様体学習:連続制御のための表現の統合と評価
- Authors: Rika Antonova, Maksim Maydanskiy, Danica Kragic, Sam Devlin, Katja
Hofmann
- Abstract要約: ストリーミング高次元観測から再利用可能な状態表現を学習する問題に対処する。
これは強化学習(Reinforcement Learning, RL)のような分野において重要であり、トレーニング中に非定常的なデータ分布を生成する。
- 参考スコア(独自算出の注目度): 32.773203015440075
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the problem of learning reusable state representations from
streaming high-dimensional observations. This is important for areas like
Reinforcement Learning (RL), which yields non-stationary data distributions
during training. We make two key contributions. First, we propose an evaluation
suite that measures alignment between latent and true low-dimensional states.
We benchmark several widely used unsupervised learning approaches. This
uncovers the strengths and limitations of existing approaches that impose
additional constraints/objectives on the latent space. Our second contribution
is a unifying mathematical formulation for learning latent relations. We learn
analytic relations on source domains, then use these relations to help
structure the latent space when learning on target domains. This formulation
enables a more general, flexible and principled way of shaping the latent
space. It formalizes the notion of learning independent relations, without
imposing restrictive simplifying assumptions or requiring domain-specific
information. We present mathematical properties, concrete algorithms for
implementation and experimental validation of successful learning and transfer
of latent relations.
- Abstract(参考訳): ストリーミング高次元観測から再利用可能な状態表現を学習する問題に対処する。
これは強化学習(rl)のような領域において重要であり、トレーニング中に非定常データ分布を生成する。
2つの重要な貢献をします
まず,潜在状態と真の低次元状態の整合を測定する評価スイートを提案する。
我々は、広く使われている教師なし学習アプローチをベンチマークする。
これは潜在空間に追加の制約/目的を課す既存のアプローチの強みと限界を明らかにする。
第2の貢献は、潜在関係を学ぶための数学的定式化です。
ソースドメインで解析関係を学び、対象ドメインで学習するとき、潜在空間を構築するのにこれらの関係を使用する。
この定式化により、より一般的で柔軟で原理的に潜在空間を形作ることができる。
制約的な単純化やドメイン固有の情報を必要とすることなく、独立した関係を学ぶという概念を定式化する。
本稿では,数学的性質,具体的なアルゴリズムの実装,学習成功の検証,潜在関係の伝達について述べる。
関連論文リスト
- Zero-shot Model-based Reinforcement Learning using Large Language Models [12.930241182192988]
本稿では,マルコフ決定過程の動的状態を予測するために,事前学習した大規模言語モデルをどのように活用することができるかを検討する。
本稿では,モデルに基づく政策評価とデータ強化型オフ政治強化学習という2つの強化学習環境における概念実証の応用について述べる。
論文 参考訳(メタデータ) (2024-10-15T15:46:53Z) - Learning Physics-Consistent Material Behavior Without Prior Knowledge [6.691537914484337]
我々は,畳み込み入力ニューラルネットワーク(ICNN)を代理モデルとして使用することにより,制約を克服するuLEDと呼ばれる機械学習アプローチを導入する。
我々は、ノイズのかなりのレベルに対して頑健であり、データ解像度の増大とともに基礎的な真実に収束することを実証した。
論文 参考訳(メタデータ) (2024-07-25T08:24:04Z) - Towards Human-Like Machine Comprehension: Few-Shot Relational Learning in Visually-Rich Documents [16.78371134590167]
Visually-Rich Documents (VRDs) ではキーバリュー関係が一般的である
これらの非テクスト的手がかりは、人間の理解とそのような関係三重項の獲得を大幅に促進する重要な指標となる。
本研究は,VRDにおけるキー-値関係三重項の抽出を目的とした,数発のリレーショナル学習に焦点を当てた。
論文 参考訳(メタデータ) (2024-03-23T08:40:35Z) - Sample-Efficient Reinforcement Learning in the Presence of Exogenous
Information [77.19830787312743]
実世界の強化学習アプリケーションでは、学習者の観察空間は、その課題に関する関連情報と無関係情報の両方でユビキタスに高次元である。
本稿では,強化学習のための新しい問題設定法であるExogenous Decision Process (ExoMDP)を導入する。
内因性成分の大きさのサンプル複雑度で準最適ポリシーを学習するアルゴリズムであるExoRLを提案する。
論文 参考訳(メタデータ) (2022-06-09T05:19:32Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Which Mutual-Information Representation Learning Objectives are
Sufficient for Control? [80.2534918595143]
相互情報は、データの表現を学習するために魅力的な形式を提供する。
本稿では,最適政策の学習と表現のための状態表現の十分性について定式化する。
意外なことに、これらの2つの目的は、MDPの構造に関する軽度で一般的な仮定を前提に、不十分な表現をもたらす可能性がある。
論文 参考訳(メタデータ) (2021-06-14T10:12:34Z) - Bounding Information Leakage in Machine Learning [26.64770573405079]
本稿では,情報漏洩の基本的な境界について検討する。
最悪の会員推論攻撃の成功率を特定し、拘束します。
感度の高い属性とモデルパラメータの間の相互情報の境界を導出する。
論文 参考訳(メタデータ) (2021-05-09T08:49:14Z) - Fundamental Limits and Tradeoffs in Invariant Representation Learning [99.2368462915979]
多くの機械学習アプリケーションは、2つの競合する目標を達成する表現を学習する。
ミニマックスゲーム理論の定式化は、精度と不変性の基本的なトレードオフを表す。
分類と回帰の双方において,この一般的かつ重要な問題を情報論的に解析する。
論文 参考訳(メタデータ) (2020-12-19T15:24:04Z) - Learning Relation Prototype from Unlabeled Texts for Long-tail Relation
Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。
我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。
私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文 参考訳(メタデータ) (2020-11-27T06:21:12Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。