Fugu-MT 論文翻訳(概要): Analytic Manifold Learning: Unifying and Evaluating Representations for Continuous Control

論文の概要: Analytic Manifold Learning: Unifying and Evaluating Representations for Continuous Control

arxiv url: http://arxiv.org/abs/2006.08718v2
Date: Tue, 6 Oct 2020 19:43:50 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-21 04:01:06.543475
Title: Analytic Manifold Learning: Unifying and Evaluating Representations for Continuous Control
Title（参考訳）: 解析多様体学習:連続制御のための表現の統合と評価
Authors: Rika Antonova, Maksim Maydanskiy, Danica Kragic, Sam Devlin, Katja Hofmann
Abstract要約: ストリーミング高次元観測から再利用可能な状態表現を学習する問題に対処する。これは強化学習(Reinforcement Learning, RL)のような分野において重要であり、トレーニング中に非定常的なデータ分布を生成する。
参考スコア（独自算出の注目度）: 32.773203015440075
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We address the problem of learning reusable state representations from streaming high-dimensional observations. This is important for areas like Reinforcement Learning (RL), which yields non-stationary data distributions during training. We make two key contributions. First, we propose an evaluation suite that measures alignment between latent and true low-dimensional states. We benchmark several widely used unsupervised learning approaches. This uncovers the strengths and limitations of existing approaches that impose additional constraints/objectives on the latent space. Our second contribution is a unifying mathematical formulation for learning latent relations. We learn analytic relations on source domains, then use these relations to help structure the latent space when learning on target domains. This formulation enables a more general, flexible and principled way of shaping the latent space. It formalizes the notion of learning independent relations, without imposing restrictive simplifying assumptions or requiring domain-specific information. We present mathematical properties, concrete algorithms for implementation and experimental validation of successful learning and transfer of latent relations.
Abstract（参考訳）: ストリーミング高次元観測から再利用可能な状態表現を学習する問題に対処する。これは強化学習(rl)のような領域において重要であり、トレーニング中に非定常データ分布を生成する。 2つの重要な貢献をしますまず,潜在状態と真の低次元状態の整合を測定する評価スイートを提案する。我々は、広く使われている教師なし学習アプローチをベンチマークする。これは潜在空間に追加の制約/目的を課す既存のアプローチの強みと限界を明らかにする。第2の貢献は、潜在関係を学ぶための数学的定式化です。ソースドメインで解析関係を学び、対象ドメインで学習するとき、潜在空間を構築するのにこれらの関係を使用する。この定式化により、より一般的で柔軟で原理的に潜在空間を形作ることができる。制約的な単純化やドメイン固有の情報を必要とすることなく、独立した関係を学ぶという概念を定式化する。本稿では,数学的性質,具体的なアルゴリズムの実装,学習成功の検証,潜在関係の伝達について述べる。

関連論文リスト

Wasserstein Transfer Learning [2.7641833515562135]
本稿では,ワッサーシュタイン空間に分布する確率分布を出力とする回帰モデルにおいて,伝達学習のための新しいフレームワークを提案する。転送可能なソース領域の情報的部分集合が知られているとき、我々は、転送効率に対するドメイン類似性の影響を定量化する、証明可能な収束率を持つ推定器を提案する。情報的サブセットが不明な場合には、負の転送を緩和するデータ駆動型転送学習手法を開発する。
論文参考訳（メタデータ） (2025-05-23T02:38:03Z)
The quasi-semantic competence of LLMs: a case study on the part-whole relation [53.37191762146552]
我々は,アンフィパル・ホール関係,すなわちアンフェロニミーの知識について検討する。 Emphquasi-semantic'のモデルは、単にemphquasi-semantic'の能力を持つだけで、深い推論特性の取得には至っていないことを示す。
論文参考訳（メタデータ） (2025-04-03T08:41:26Z)
Zero-shot Model-based Reinforcement Learning using Large Language Models [12.930241182192988]
本稿では,マルコフ決定過程の動的状態を予測するために,事前学習した大規模言語モデルをどのように活用することができるかを検討する。本稿では,モデルに基づく政策評価とデータ強化型オフ政治強化学習という2つの強化学習環境における概念実証の応用について述べる。
論文参考訳（メタデータ） (2024-10-15T15:46:53Z)
Learning Physics-Consistent Material Behavior Without Prior Knowledge [6.691537914484337]
我々は,畳み込み入力ニューラルネットワーク(ICNN)を代理モデルとして使用することにより,制約を克服するuLEDと呼ばれる機械学習アプローチを導入する。我々は、ノイズのかなりのレベルに対して頑健であり、データ解像度の増大とともに基礎的な真実に収束することを実証した。
論文参考訳（メタデータ） (2024-07-25T08:24:04Z)
Towards Human-Like Machine Comprehension: Few-Shot Relational Learning in Visually-Rich Documents [16.78371134590167]
Visually-Rich Documents (VRDs) ではキーバリュー関係が一般的であるこれらの非テクスト的手がかりは、人間の理解とそのような関係三重項の獲得を大幅に促進する重要な指標となる。本研究は,VRDにおけるキー-値関係三重項の抽出を目的とした,数発のリレーショナル学習に焦点を当てた。
論文参考訳（メタデータ） (2024-03-23T08:40:35Z)
Sample-Efficient Reinforcement Learning in the Presence of Exogenous Information [77.19830787312743]
実世界の強化学習アプリケーションでは、学習者の観察空間は、その課題に関する関連情報と無関係情報の両方でユビキタスに高次元である。本稿では,強化学習のための新しい問題設定法であるExogenous Decision Process (ExoMDP)を導入する。内因性成分の大きさのサンプル複雑度で準最適ポリシーを学習するアルゴリズムであるExoRLを提案する。
論文参考訳（メタデータ） (2022-06-09T05:19:32Z)
On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文参考訳（メタデータ） (2022-03-08T09:57:48Z)
Towards Robust Bisimulation Metric Learning [3.42658286826597]
ビシミュレーションメトリクスは、表現学習問題に対する一つの解決策を提供する。非最適ポリシーへのオン・ポリティクス・バイシミュレーション・メトリクスの値関数近似境界を一般化する。これらの問題は、制約の少ない力学モデルと、報酬信号への埋め込みノルムの不安定な依存に起因する。
論文参考訳（メタデータ） (2021-10-27T00:32:07Z)
Which Mutual-Information Representation Learning Objectives are Sufficient for Control? [80.2534918595143]
相互情報は、データの表現を学習するために魅力的な形式を提供する。本稿では,最適政策の学習と表現のための状態表現の十分性について定式化する。意外なことに、これらの2つの目的は、MDPの構造に関する軽度で一般的な仮定を前提に、不十分な表現をもたらす可能性がある。
論文参考訳（メタデータ） (2021-06-14T10:12:34Z)
Bounding Information Leakage in Machine Learning [26.64770573405079]
本稿では,情報漏洩の基本的な境界について検討する。最悪の会員推論攻撃の成功率を特定し、拘束します。感度の高い属性とモデルパラメータの間の相互情報の境界を導出する。
論文参考訳（メタデータ） (2021-05-09T08:49:14Z)
Fundamental Limits and Tradeoffs in Invariant Representation Learning [99.2368462915979]
多くの機械学習アプリケーションは、2つの競合する目標を達成する表現を学習する。ミニマックスゲーム理論の定式化は、精度と不変性の基本的なトレードオフを表す。分類と回帰の双方において,この一般的かつ重要な問題を情報論的に解析する。
論文参考訳（メタデータ） (2020-12-19T15:24:04Z)
Learning Relation Prototype from Unlabeled Texts for Long-tail Relation Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文参考訳（メタデータ） (2020-11-27T06:21:12Z)
Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。私たちのフレームワークは、サンプル間の関係をよく保存します。サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文参考訳（メタデータ） (2020-07-11T10:57:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。