論文の概要: Knot So Simple: A Minimalistic Environment for Spatial Reasoning
- arxiv url: http://arxiv.org/abs/2505.18028v1
- Date: Fri, 23 May 2025 15:34:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:34.197131
- Title: Knot So Simple: A Minimalistic Environment for Spatial Reasoning
- Title(参考訳): Knot So Simple:空間推論のための最小限の環境
- Authors: Zizhao Chen, Yoav Artzi,
- Abstract要約: KnotGymは複雑な空間的推論と操作のための対話型環境である。
ゴール指向のロープ操作タスクで、さまざまなレベルの複雑さがあり、すべて純粋な画像観察から行動する必要がある。
モデルベースRL, モデル予測制御, チェーン・オブ・シークレット推論など, 様々なクラスの手法を評価する。
- 参考スコア(独自算出の注目度): 15.45837233626757
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose KnotGym, an interactive environment for complex, spatial reasoning and manipulation. KnotGym includes goal-oriented rope manipulation tasks with varying levels of complexity, all requiring acting from pure image observations. Tasks are defined along a clear and quantifiable axis of complexity based on the number of knot crossings, creating a natural generalization test. KnotGym has a simple observation space, allowing for scalable development, yet it highlights core challenges in integrating acute perception, spatial reasoning, and grounded manipulation. We evaluate methods of different classes, including model-based RL, model-predictive control, and chain-of-thought reasoning, and illustrate the challenges KnotGym presents. KnotGym is available at https://github.com/lil-lab/knotgym.
- Abstract(参考訳): 複雑・空間的推論・操作のための対話型環境であるKnotGymを提案する。
KnotGymには、さまざまなレベルの複雑さを持つゴール指向のロープ操作タスクが含まれている。
タスクは、結び目の数に基づいて、明確で定量化可能な複雑さの軸に沿って定義され、自然な一般化テストが作成される。
KnotGymはシンプルな観察空間を持ち、スケーラブルな開発を可能にするが、鋭い知覚、空間的推論、接地された操作を統合する上でのコア課題を強調している。
モデルベースRL, モデル予測制御, チェーン・オブ・シント推論など, 様々なクラスの手法を評価し, KnotGymが提示する課題について述べる。
KnotGymはhttps://github.com/lil-lab/knotgym.comで入手できる。
関連論文リスト
- Towards Graph Foundation Models: Learning Generalities Across Graphs via Task-Trees [50.78679002846741]
グラフにおけるクロスタスクの一般性を学習するための新しいアプローチを提案する。
グラフ上のタスク空間を整列させるための基本的な学習インスタンスとしてタスクツリーを提案する。
その結果,グラフニューラルネットワークが多種多様なタスクツリーで事前訓練された場合,伝達可能な知識を取得することが示唆された。
論文 参考訳(メタデータ) (2024-12-21T02:07:43Z) - Towards Dynamic Message Passing on Graphs [104.06474765596687]
グラフニューラルネットワーク(GNN)のための新しい動的メッセージパッシング機構を提案する。
グラフノードと学習可能な擬似ノードを、測定可能な空間関係を持つ共通空間に投影する。
ノードが空間内を移動すると、その進化する関係は動的メッセージパッシングプロセスのための柔軟な経路構築を促進する。
論文 参考訳(メタデータ) (2024-10-31T07:20:40Z) - Non-convolutional Graph Neural Networks [46.79328529882998]
畳み込み演算子を完全に含まない単純なグラフ学習モジュールを設計し、RUMニューラルネットワークを用いたランダムウォークを作成した。
RUMは競合する性能を実現するが、より堅牢で、メモリ効率が高く、スケーラブルで、最も単純な畳み込みGNNよりも高速である。
論文 参考訳(メタデータ) (2024-07-31T21:29:26Z) - Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - VQ-GNN: A Universal Framework to Scale up Graph Neural Networks using
Vector Quantization [70.8567058758375]
VQ-GNNは、Vector Quantization(VQ)を使用して、パフォーマンスを損なうことなく、畳み込みベースのGNNをスケールアップするための普遍的なフレームワークである。
我々のフレームワークは,グラフ畳み込み行列の低ランク版と組み合わせた量子化表現を用いて,GNNの「隣の爆発」問題を回避する。
論文 参考訳(メタデータ) (2021-10-27T11:48:50Z) - Efficient and Interpretable Robot Manipulation with Graph Neural
Networks [7.799182201815763]
グラフニューラルネットワーク(GNN)を用いて、グラフ上の操作として操作タスクを表現する。
我々の定式化はまず環境をグラフ表現に変換し、次に訓練されたgnnポリシーを適用してどのオブジェクトを操作するかを予測する。
私たちのgnnポリシーは、単純なタスクの専門的なデモンストレーションを使用してトレーニングされ、環境内のオブジェクトの数と構成を一般化しています。
本稿では,学習したGNNポリシがシミュレーションと実ハードウェアの両方で様々なブロックタッキングタスクを解くことができることを示す実験を提案する。
論文 参考訳(メタデータ) (2021-02-25T21:09:12Z) - Action Recognition with Kernel-based Graph Convolutional Networks [14.924672048447338]
learning graph convolutional networks(gcns)は、ディープラーニングを任意の非正規ドメインに一般化することを目的としている。
再生カーネルヒルベルト空間(RKHS)における空間グラフ畳み込みを実現する新しいGCNフレームワークを提案する。
gcnモデルの特長は、学習グラフフィルタの受容野のノードと入力グラフのノードを明示的に認識せずに畳み込みを実現する能力にも関係しています。
論文 参考訳(メタデータ) (2020-12-28T11:02:51Z) - Mixed Membership Graph Clustering via Systematic Edge Query [22.77704627076251]
この研究は、ほとんど不完全なグラフのクラスタリングノードを考慮する。
問題設定の下では、エッジに関する少数のクエリしか作成できないが、グラフ全体はオブザーバブルではない。
この問題は,限定アノテーションを用いた大規模データクラスタリング,限定された調査リソースによるコミュニティ検出,グラフトポロジ推論などに適用できる。
論文 参考訳(メタデータ) (2020-11-25T19:19:05Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。