論文の概要: Analytic Manifold Learning: Unifying and Evaluating Representations for
Continuous Control
- arxiv url: http://arxiv.org/abs/2006.08718v2
- Date: Tue, 6 Oct 2020 19:43:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 04:01:06.543475
- Title: Analytic Manifold Learning: Unifying and Evaluating Representations for
Continuous Control
- Title(参考訳): 解析多様体学習:連続制御のための表現の統合と評価
- Authors: Rika Antonova, Maksim Maydanskiy, Danica Kragic, Sam Devlin, Katja
Hofmann
- Abstract要約: ストリーミング高次元観測から再利用可能な状態表現を学習する問題に対処する。
これは強化学習(Reinforcement Learning, RL)のような分野において重要であり、トレーニング中に非定常的なデータ分布を生成する。
- 参考スコア(独自算出の注目度): 32.773203015440075
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the problem of learning reusable state representations from
streaming high-dimensional observations. This is important for areas like
Reinforcement Learning (RL), which yields non-stationary data distributions
during training. We make two key contributions. First, we propose an evaluation
suite that measures alignment between latent and true low-dimensional states.
We benchmark several widely used unsupervised learning approaches. This
uncovers the strengths and limitations of existing approaches that impose
additional constraints/objectives on the latent space. Our second contribution
is a unifying mathematical formulation for learning latent relations. We learn
analytic relations on source domains, then use these relations to help
structure the latent space when learning on target domains. This formulation
enables a more general, flexible and principled way of shaping the latent
space. It formalizes the notion of learning independent relations, without
imposing restrictive simplifying assumptions or requiring domain-specific
information. We present mathematical properties, concrete algorithms for
implementation and experimental validation of successful learning and transfer
of latent relations.
- Abstract(参考訳): ストリーミング高次元観測から再利用可能な状態表現を学習する問題に対処する。
これは強化学習(rl)のような領域において重要であり、トレーニング中に非定常データ分布を生成する。
2つの重要な貢献をします
まず,潜在状態と真の低次元状態の整合を測定する評価スイートを提案する。
我々は、広く使われている教師なし学習アプローチをベンチマークする。
これは潜在空間に追加の制約/目的を課す既存のアプローチの強みと限界を明らかにする。
第2の貢献は、潜在関係を学ぶための数学的定式化です。
ソースドメインで解析関係を学び、対象ドメインで学習するとき、潜在空間を構築するのにこれらの関係を使用する。
この定式化により、より一般的で柔軟で原理的に潜在空間を形作ることができる。
制約的な単純化やドメイン固有の情報を必要とすることなく、独立した関係を学ぶという概念を定式化する。
本稿では,数学的性質,具体的なアルゴリズムの実装,学習成功の検証,潜在関係の伝達について述べる。
関連論文リスト
- Active Self-Supervised Learning: A Few Low-Cost Relationships Are All
You Need [34.013568381942775]
Self-Supervised Learning (SSL)は、ラベルのないデータから転送可能な表現を学習する選択肢のソリューションとして登場した。
本研究では,この原理を正のアクティブラーニング(PAL)によって形式化し,一般化する。
まず、SSLを超えて理論的に基礎を成す学習フレームワークを公開し、類似性グラフに基づいて、採用するオラクルに応じて教師付きおよび半教師付き学習に取り組むように拡張する。
第二に、事前知識、例えばいくつかのラベルをトレーニングパイプラインの変更なしにSSL損失に組み込むための一貫したアルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-03-27T14:44:39Z) - Sample-Efficient Reinforcement Learning in the Presence of Exogenous
Information [77.19830787312743]
実世界の強化学習アプリケーションでは、学習者の観察空間は、その課題に関する関連情報と無関係情報の両方でユビキタスに高次元である。
本稿では,強化学習のための新しい問題設定法であるExogenous Decision Process (ExoMDP)を導入する。
内因性成分の大きさのサンプル複雑度で準最適ポリシーを学習するアルゴリズムであるExoRLを提案する。
論文 参考訳(メタデータ) (2022-06-09T05:19:32Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Towards Robust Bisimulation Metric Learning [3.42658286826597]
ビシミュレーションメトリクスは、表現学習問題に対する一つの解決策を提供する。
非最適ポリシーへのオン・ポリティクス・バイシミュレーション・メトリクスの値関数近似境界を一般化する。
これらの問題は、制約の少ない力学モデルと、報酬信号への埋め込みノルムの不安定な依存に起因する。
論文 参考訳(メタデータ) (2021-10-27T00:32:07Z) - Towards a theory of out-of-distribution learning [22.55793847392211]
我々は,学習者が与えられた問題に対してデータを活用することができる量を定量化するために,テキストバッファラーニング効率(LE)を導入する。
本稿では,このフレームワークが伝達,マルチタスク,メタ,継続,生涯学習を特徴付けるのにいかに汎用的であるかを示す。
論文 参考訳(メタデータ) (2021-09-29T15:35:16Z) - Which Mutual-Information Representation Learning Objectives are
Sufficient for Control? [80.2534918595143]
相互情報は、データの表現を学習するために魅力的な形式を提供する。
本稿では,最適政策の学習と表現のための状態表現の十分性について定式化する。
意外なことに、これらの2つの目的は、MDPの構造に関する軽度で一般的な仮定を前提に、不十分な表現をもたらす可能性がある。
論文 参考訳(メタデータ) (2021-06-14T10:12:34Z) - Bounding Information Leakage in Machine Learning [26.64770573405079]
本稿では,情報漏洩の基本的な境界について検討する。
最悪の会員推論攻撃の成功率を特定し、拘束します。
感度の高い属性とモデルパラメータの間の相互情報の境界を導出する。
論文 参考訳(メタデータ) (2021-05-09T08:49:14Z) - Fundamental Limits and Tradeoffs in Invariant Representation Learning [99.2368462915979]
多くの機械学習アプリケーションは、2つの競合する目標を達成する表現を学習する。
ミニマックスゲーム理論の定式化は、精度と不変性の基本的なトレードオフを表す。
分類と回帰の双方において,この一般的かつ重要な問題を情報論的に解析する。
論文 参考訳(メタデータ) (2020-12-19T15:24:04Z) - Learning Relation Prototype from Unlabeled Texts for Long-tail Relation
Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。
我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。
私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文 参考訳(メタデータ) (2020-11-27T06:21:12Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。