論文の概要: Improved Representation of Asymmetrical Distances with Interval
Quasimetric Embeddings
- arxiv url: http://arxiv.org/abs/2211.15120v2
- Date: Fri, 5 Jan 2024 19:27:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-10 00:37:37.387588
- Title: Improved Representation of Asymmetrical Distances with Interval
Quasimetric Embeddings
- Title(参考訳): 間隔準メトリック埋め込みによる非対称距離の表現の改善
- Authors: Tongzhou Wang, Phillip Isola
- Abstract要約: 非対称距離構造(準距離構造)は、私たちの生活においてユビキタスであり、機械学習応用においてより注目を集めている。
このような準計量モデルに4つの望ましい性質を示し、先行研究がそれに対してどのように失敗するかを示す。
4つの基準を全て満たすために, IQE (Interval Quasimetric Embedding) を提案する。
- 参考スコア(独自算出の注目度): 45.69333765438636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Asymmetrical distance structures (quasimetrics) are ubiquitous in our lives
and are gaining more attention in machine learning applications. Imposing such
quasimetric structures in model representations has been shown to improve many
tasks, including reinforcement learning (RL) and causal relation learning. In
this work, we present four desirable properties in such quasimetric models, and
show how prior works fail at them. We propose Interval Quasimetric Embedding
(IQE), which is designed to satisfy all four criteria. On three quasimetric
learning experiments, IQEs show strong approximation and generalization
abilities, leading to better performance and improved efficiency over prior
methods.
Project Page: https://www.tongzhouwang.info/interval_quasimetric_embedding
Quasimetric Learning Code Package:
https://www.github.com/quasimetric-learning/torch-quasimetric
- Abstract(参考訳): 非対称距離構造(準距離構造)は、私たちの生活においてユビキタスであり、機械学習応用においてより注目を集めている。
このような準計量構造をモデル表現に取り入れることで、強化学習(RL)や因果関係学習など、多くの課題が改善されることが示されている。
本研究では,そのような準メトリックモデルにおいて4つの望ましい性質を示し,それに対してどのように先行作用が失敗するかを示す。
4つの基準を全て満たすために, IQE (Interval Quasimetric Embedding) を提案する。
3つの準メトリック学習実験において、iqeは強い近似と一般化能力を示し、従来の方法よりも優れた性能と効率をもたらす。
Project Page: https://www.tongzhouwang.info/interval_quasimetric_embedding Quasimetric Learning Code Package: https://www.github.com/quasimetric-learning/torch-quasimetric
関連論文リスト
- Approximate Equivariance in Reinforcement Learning [35.04248486334824]
等変ニューラルネットワークは強化学習において大きな成功を収めている。
多くの問題において、近似対称性のみが存在しており、これは正確な対称性を不適切なものにしている。
我々は、強化学習におけるほぼ同変のアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-11-06T19:44:46Z) - Noether's razor: Learning Conserved Quantities [16.81984465529089]
我々は対称性を学習可能な保存量としてパラメータ化する。
次に、保存された量と関連する対称性を直接列車データから学ぶことを許す。
この手法は正しい保存量と U($n$) および SE($n$) 対称性群を正しく同定する。
論文 参考訳(メタデータ) (2024-10-10T16:29:49Z) - A Generative Model of Symmetry Transformations [44.87295754993983]
我々はデータの近似対称性を明示的に捉えることを目的とした生成モデルを構築した。
我々は、アフィンおよび色変換の下で対称性を捕捉する能力を実証的に実証した。
論文 参考訳(メタデータ) (2024-03-04T11:32:18Z) - ${\rm E}(3)$-Equivariant Actor-Critic Methods for Cooperative Multi-Agent Reinforcement Learning [7.712824077083934]
我々は,ある協調型マルチエージェント強化学習問題に固有のユークリッド対称性の活用に焦点をあてる。
我々は,マルチエージェントアクター批判手法の帰納バイアスとして,対称的制約を組み込んだニューラルネットワークアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-08-23T00:18:17Z) - Understanding Augmentation-based Self-Supervised Representation Learning
via RKHS Approximation and Regression [53.15502562048627]
最近の研究は、自己教師付き学習とグラフラプラシアン作用素のトップ固有空間の近似との関係を構築している。
この研究は、増強に基づく事前訓練の統計的分析に発展する。
論文 参考訳(メタデータ) (2023-06-01T15:18:55Z) - Optimal Goal-Reaching Reinforcement Learning via Quasimetric Learning [73.80728148866906]
準メトリック強化学習(QRL)は、準メトリックモデルを用いて最適な値関数を学習する新しいRL法である。
オフラインおよびオンラインの目標達成ベンチマークでは、QRLはサンプル効率とパフォーマンスが改善されている。
論文 参考訳(メタデータ) (2023-04-03T17:59:58Z) - SPE: Symmetrical Prompt Enhancement for Fact Probing [81.82104239636574]
事前学習型言語モデル(PLM)における事実探索のための連続的プロンプトベース手法を提案する。
その結果,従来の探索手法に比べて,SPEの大幅な改善が見られた。
論文 参考訳(メタデータ) (2022-11-14T03:05:41Z) - On the Learning and Learnablity of Quasimetrics [32.0469500831667]
強化学習と制御において、最適目標獲得戦略はめったに逆転しない(対称)
一般的な外見にもかかわらず、準計量の学習についてはほとんど研究されていない。
提案したPoisson Quasimetric Embedding (PQE) は、勾配に基づく最適化で学習可能な最初の準メトリック学習定式化である。
論文 参考訳(メタデータ) (2022-06-30T17:59:52Z) - Hyperbolic Vision Transformers: Combining Improvements in Metric
Learning [116.13290702262248]
計量学習のための新しい双曲型モデルを提案する。
本手法のコアとなるのは、双曲空間にマッピングされた出力埋め込みを備えた視覚変換器である。
4つのデータセットに6つの異なる定式化を施したモデルの評価を行った。
論文 参考訳(メタデータ) (2022-03-21T09:48:23Z) - Online Target Q-learning with Reverse Experience Replay: Efficiently
finding the Optimal Policy for Linear MDPs [50.75812033462294]
我々は,Q-ラーニングの実践的成功と悲観的理論的結果とのギャップを埋める。
本稿では,新しいQ-Rex法とQ-RexDaReを提案する。
Q-Rex は線形 MDP の最適ポリシを効率的に見つけることができる。
論文 参考訳(メタデータ) (2021-10-16T01:47:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。