論文の概要: Asymmetric Norms to Approximate the Minimum Action Distance
- arxiv url: http://arxiv.org/abs/2312.10276v1
- Date: Sat, 16 Dec 2023 00:50:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 17:38:50.690099
- Title: Asymmetric Norms to Approximate the Minimum Action Distance
- Title(参考訳): 最小作用距離を近似する非対称ノルム
- Authors: Lorenzo Steccanella, Anders Jonsson
- Abstract要約: 本稿では,報酬のないマルコフ決定過程の状態表現について述べる。
我々は、この表現がどのようにしてゴール条件付きポリシーを学ぶことができるかを示す。
- 参考スコア(独自算出の注目度): 9.040428950629153
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a state representation for reward-free Markov decision
processes. The idea is to learn, in a self-supervised manner, an embedding
space where distances between pairs of embedded states correspond to the
minimum number of actions needed to transition between them. Unlike previous
methods, our approach incorporates an asymmetric norm parametrization, enabling
accurate approximations of minimum action distances in environments with
inherent asymmetry. We show how this representation can be leveraged to learn
goal-conditioned policies, providing a notion of similarity between states and
goals and a useful heuristic distance to guide planning. To validate our
approach, we conduct empirical experiments on both symmetric and asymmetric
environments. Our results show that our asymmetric norm parametrization
performs comparably to symmetric norms in symmetric environments and surpasses
symmetric norms in asymmetric environments.
- Abstract(参考訳): 本稿では,報酬のないマルコフ決定過程の状態表現について述べる。
この考え方は自己監督的な方法で、組込み状態のペア間の距離がそれらの間の遷移に必要な最小のアクション数に対応する埋め込み空間を学ぶことである。
従来の手法とは異なり、本手法では非対称ノルムパラメータ化を取り入れ、固有非対称性を有する環境における最小動作距離の正確な近似を可能にする。
この表現を,目標条件ポリシーの学習に活用し,状態と目標の類似性の概念と,計画の指導に有用なヒューリスティック距離を提供する。
アプローチを検証するため,対称環境と非対称環境の両方で実験を行った。
我々の非対称ノルムパラメトリゼーションは、対称環境における対称ノルムと互換性があり、非対称環境における対称ノルムを超えることを示す。
関連論文リスト
- Asymmetry of the Relative Entropy in the Regularization of Empirical Risk Minimization [45.935798913942904]
相対エントロピー非対称性の効果は、経験的リスク最小化の文脈で分析される。
良く理解されたタイプI ERM-RERとタイプII ERM-RERを比較することにより、エントロピー非対称性の影響が強調される。
その結果,Type-II正則化は経験的リスク関数の適切な変換を伴うType-I正則化と同値であることが示唆された。
論文 参考訳(メタデータ) (2024-10-02T09:43:43Z) - How much symmetry do symmetric measurements need for efficient operational applications? [0.0]
情報的完備集合に対しては、正則エルミート作用素基底を用いた構成法を提案する。
一般化の過程で失われる対称性の性質のいくつかは、すべてのPOVMに対して同じ数の要素を固定することなく回復することができる。
論文 参考訳(メタデータ) (2024-04-02T15:23:08Z) - Equivariant Symmetry Breaking Sets [0.6475999521931204]
等価ニューラルネットワーク(ENN)は、基礎となる対称性を含むアプリケーションに非常に効果的であることが示されている。
完全同変で、自発対称性の破れに対処する最初のフレームワークである新しい対称性破れフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-05T02:35:11Z) - Self-Supervised Detection of Perfect and Partial Input-Dependent Symmetries [11.54837584979607]
群の同値性は、群の対称性がデータで観測されたものと異なる場合、過度にモデルを制約することができる。
本稿では,ラベルを使わずに各入力の対称性のレベルを検出する手法を提案する。
我々のフレームワークは、連続分布と離散対称性分布の両方の異なる族に対応するのに十分である。
論文 参考訳(メタデータ) (2023-12-19T15:11:46Z) - Regularizing Towards Soft Equivariance Under Mixed Symmetries [23.603875905608565]
混合近似対称性を持つデータセットのモデルを構築するための正規化器に基づく手法を提案する。
提案手法は,近似対称性のレベルを正確に発見しながら,従来の手法よりも精度が高いことを示す。
論文 参考訳(メタデータ) (2023-06-01T05:33:41Z) - Improved Representation of Asymmetrical Distances with Interval
Quasimetric Embeddings [45.69333765438636]
非対称距離構造(準距離構造)は、私たちの生活においてユビキタスであり、機械学習応用においてより注目を集めている。
このような準計量モデルに4つの望ましい性質を示し、先行研究がそれに対してどのように失敗するかを示す。
4つの基準を全て満たすために, IQE (Interval Quasimetric Embedding) を提案する。
論文 参考訳(メタデータ) (2022-11-28T08:22:26Z) - On the Importance of Asymmetry for Siamese Representation Learning [53.86929387179092]
シームズネットワークは、2つの並列エンコーダと概念的に対称である。
ネットワーク内の2つのエンコーダを明確に区別することで,非対称性の重要性について検討する。
非対称設計による改善は、より長いトレーニングスケジュール、複数の他のフレームワーク、より新しいバックボーンに一般化されている。
論文 参考訳(メタデータ) (2022-04-01T17:57:24Z) - Optimal variance-reduced stochastic approximation in Banach spaces [114.8734960258221]
可分バナッハ空間上で定義された収縮作用素の定点を推定する問題について検討する。
演算子欠陥と推定誤差の両方に対して漸近的でない境界を確立する。
論文 参考訳(メタデータ) (2022-01-21T02:46:57Z) - Symmetry Breaking in Symmetric Tensor Decomposition [44.181747424363245]
我々は、対称テンソルの点階分解を計算する非対称問題を考える。
損失関数の臨界点が標準手法によって検出されることを示す。
論文 参考訳(メタデータ) (2021-03-10T18:11:22Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z) - The quantum marginal problem for symmetric states: applications to
variational optimization, nonlocality and self-testing [0.0]
対称$d$レベルのシステムに対する量子境界問題の解法を提案する。
量子情報中心問題における本手法の適用性について,いくつかの事例研究で概説する。
論文 参考訳(メタデータ) (2020-01-13T18:20:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。