論文の概要: Probabilistic World Modeling with Asymmetric Distance Measure
- arxiv url: http://arxiv.org/abs/2403.10875v1
- Date: Sat, 16 Mar 2024 09:58:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-19 21:15:47.044184
- Title: Probabilistic World Modeling with Asymmetric Distance Measure
- Title(参考訳): 非対称距離測定による確率的世界モデリング
- Authors: Meng Song,
- Abstract要約: 距離関数の学習は、表現空間における計画と推論を可能にするために不可欠であることを示す。
状態到達性を反映した非対称な類似関数を学習し、多方向確率的推論を可能にする。
共通参照状態に条件付けすることで、学習された表現空間は、ほんの一握りの経路しか通過できない幾何学的に健全な状態を発見することができる。
- 参考スコア(独自算出の注目度): 0.3021678014343889
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Representation learning is a fundamental task in machine learning, aiming at uncovering structures from data to facilitate subsequent tasks. However, what is a good representation for planning and reasoning in a stochastic world remains an open problem. In this work, we posit that learning a distance function is essential to allow planning and reasoning in the representation space. We show that a geometric abstraction of the probabilistic world dynamics can be embedded into the representation space through asymmetric contrastive learning. Unlike previous approaches that focus on learning mutual similarity or compatibility measures, we instead learn an asymmetric similarity function that reflects the state reachability and allows multi-way probabilistic inference. Moreover, by conditioning on a common reference state (e.g. the observer's current state), the learned representation space allows us to discover the geometrically salient states that only a handful of paths can lead through. These states can naturally serve as subgoals to break down long-horizon planning tasks. We evaluate our method in gridworld environments with various layouts and demonstrate its effectiveness in discovering the subgoals.
- Abstract(参考訳): 表現学習(representation learning)は、データから構造を明らかにすることを目的とした機械学習の基本的なタスクである。
しかし、確率的世界における計画と推論のよい表現は、依然として未解決の問題である。
本研究では,距離関数の学習が表現空間における計画と推論を許容する上で重要であると仮定する。
確率的世界力学の幾何学的抽象化が非対称コントラスト学習によって表現空間に埋め込まれることが示される。
相互類似性や適合度を学習する従来の手法とは異なり、状態到達性を反映した非対称類似性関数を学習し、マルチウェイ確率的推論を可能にする。
さらに、共通参照状態(例えばオブザーバの現在の状態)を条件付けすることで、学習された表現空間は、ほんの一握りの経路しか通過できない幾何学的に健全な状態を発見することができる。
これらの州は、ロングホライズン計画のタスクを壊すためのサブゴールとして自然に機能する。
本手法はグリッドワールド環境において,様々なレイアウトで評価し,サブゴール発見の有効性を実証する。
関連論文リスト
- PALMER: Perception-Action Loop with Memory for Long-Horizon Planning [1.5469452301122177]
PALMERと呼ばれる汎用計画アルゴリズムを導入する。
Palmerは古典的なサンプリングベースの計画アルゴリズムと学習に基づく知覚表現を組み合わせる。
これにより、表現学習、記憶、強化学習、サンプリングベースの計画の間に、緊密なフィードバックループが生成される。
論文 参考訳(メタデータ) (2022-12-08T22:11:49Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Masked prediction tasks: a parameter identifiability view [49.533046139235466]
マスク付きトークンの予測に広く用いられている自己教師型学習手法に着目する。
いくつかの予測タスクは識別可能性をもたらすが、他のタスクはそうではない。
論文 参考訳(メタデータ) (2022-02-18T17:09:32Z) - Instance Similarity Learning for Unsupervised Feature Representation [83.31011038813459]
教師なし特徴表現のための例類似性学習(ISL)手法を提案する。
我々はGAN(Generative Adversarial Networks)を用いて、基礎となる特徴多様体をマイニングする。
画像分類実験は, 最先端手法と比較して, 提案手法の優位性を示した。
論文 参考訳(メタデータ) (2021-08-05T16:42:06Z) - Abstract Spatial-Temporal Reasoning via Probabilistic Abduction and
Execution [97.50813120600026]
時空間推論は人工知能(AI)の課題である
最近の研究は、この種の抽象的推論タスクに焦点を当てている -- Raven's Progressive Matrices (RPM)
ニューロシンボリックな確率的アブダクションと実行学習者(PrAE)を提案する。
論文 参考訳(メタデータ) (2021-03-26T02:42:18Z) - Generalized Inverse Planning: Learning Lifted non-Markovian Utility for
Generalizable Task Representation [83.55414555337154]
本研究では,人間の実演からこのような有用性を学ぶことを研究する。
本稿では,本領域におけるユーティリティ学習のための新しい探索手法である一般化逆計画を提案する。
計算フレームワークである最大エントロピー逆計画(MEIP)について概説し、非マルコフ的効用と関連する概念を生成的に学習する。
論文 参考訳(メタデータ) (2020-11-12T21:06:26Z) - Learning intuitive physics and one-shot imitation using
state-action-prediction self-organizing maps [0.0]
人間は探索と模倣によって学び、世界の因果モデルを構築し、両方を使って新しいタスクを柔軟に解決する。
このような特徴を生み出す単純だが効果的な教師なしモデルを提案する。
エージェントがアクティブな推論スタイルで柔軟に解決する、複数の関連するが異なる1ショットの模倣タスクに対して、その性能を示す。
論文 参考訳(メタデータ) (2020-07-03T12:29:11Z) - On Equivariant and Invariant Learning of Object Landmark Representations [36.214069685880986]
実例識別学習と空間識別学習を組み合わせた,シンプルで効果的な手法を開発した。
深層ネットワークが幾何学的および測光的変換に不変であるように訓練されると、その中間層から表現が出現し、物体のランドマークを高い精度で予測できることが示される。
論文 参考訳(メタデータ) (2020-06-26T04:06:56Z) - Neural Topological SLAM for Visual Navigation [112.73876869904]
意味論を生かし、近似幾何学的推論を行う空間のトポロジ的表現を設計する。
本稿では,ノイズのあるアクティベーションの下でそのような表現を構築し,維持し,使用することができる教師付き学習ベースアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2020-05-25T17:56:29Z) - Symbolic Learning and Reasoning with Noisy Data for Probabilistic
Anchoring [19.771392829416992]
ボトムアップオブジェクトアンカーに基づくセマンティックワールドモデリング手法を提案する。
我々は、マルチモーダル確率分布を扱うためにアンカーの定義を拡張した。
我々は統計的リレーショナル・ラーニングを用いて、アンカーリング・フレームワークが記号的知識を学習できるようにする。
論文 参考訳(メタデータ) (2020-02-24T16:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。