論文の概要: S2M-Trek: From Single to Multi-Sphere Transport via Per-Frame Deep Sets on a Wheel-Legged Robot
- arxiv url: http://arxiv.org/abs/2606.01332v1
- Date: Sun, 31 May 2026 16:35:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.591213
- Title: S2M-Trek: From Single to Multi-Sphere Transport via Per-Frame Deep Sets on a Wheel-Legged Robot
- Title(参考訳): S2M-Trek:車輪付きロボットのフレームごとの深部集合による単一から複数球体輸送
- Authors: Zong Chen, Xuebin Li, Jinpeng Xiao, Shaoyang Li, Ben Liu, Min Li, Zhouping Yin, Yiqun Li,
- Abstract要約: 車輪脚四重組の裏面に同時に搬送される複数球面への1つの自由回転球面からの動的ロコマニピュレーションのスケーリング問題について検討した。
複数の同一自由回転球面は、永続的な恒等性を持たない無順序集合を形成する。
時間的読み出しの前に各履歴フレーム内で置換不変プーリングを行うテキストPer-Frame Deep Sets (PFDS)を提案する。
- 参考スコア(独自算出の注目度): 9.907843343817886
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of scaling dynamic loco-manipulation from a single free-rolling sphere to multiple spheres transported simultaneously on the back of a wheel-legged quadruped, without fences, grippers, or mechanical stops. Multiple identical free-rolling spheres form an unordered set with no persistent identity: their ordering may change independently at each history frame, creating a \emph{per-frame permutation symmetry} that standard history-concatenation set encoders do not explicitly enforce -- these encoders impose only a shared, diagonal permutation symmetry over the full history. We show that this symmetry mismatch leads to a concrete failure mode in curriculum-based reinforcement learning. Within the same PPO training budget, flat MLPs and branch-wise encoders plateau at or below the two-sphere stage, while a history-concatenation Deep Sets baseline (\HCDS) fails to progress past the two-sphere stage in our runs unless ball-to-slot assignments are randomised during training, suggesting that it exploits slot indices as a curriculum shortcut rather than learning identity-free multi-sphere dynamics. We propose \textbf{Per-Frame Deep Sets (\PFDS)}, which performs permutation-invariant pooling within each history frame before temporal readout; we prove that \PFDS is $\Gframe$-invariant and universally approximates continuous $\Gframe$-invariant policies. A $2{\times}2$ ablation over encoder architecture and slot randomisation separates the architectural and data-augmentation pathways, and \PFDS reaches the five-sphere stage with 100\% no-drop transport in simulation across all five random seeds. We further distill the \PFDS teacher into \TactSet via DAgger, replacing privileged sphere-state observations with a $16{\times}16$ Boolean union contact map, yielding a compact and naturally $\Gframe$-invariant tactile representation.
- Abstract(参考訳): 本研究では,1つの自由回転球面から複数球面への動的ロコマニピュレーションを,フェンスやグリップ,機械的停止を伴わずに車輪脚四重組の後方に同時に輸送する問題について検討する。
複数の同一自由回転球体は、永続的な同一性を持たない無秩序集合を形成する:それらの順序は、それぞれの歴史フレームで独立に変化し、標準的な歴史連結集合エンコーダが明示的に強制しないような \emph{per-frame permutation symmetric} を生成する。
この対称性のミスマッチは,カリキュラムに基づく強化学習において,具体的な障害モードにつながることを示す。
同じPPOトレーニング予算内では、平らなMLPと分岐エンコーダの台地が2つの球面ステージ以下であるのに対して、歴史結合型Deep Setsベースライン(\HCDS)は、トレーニング中にボールとスロットの割り当てがランダム化されない限り、我々の実行中の2つの球面ステージを通り過ぎないため、アイデンティティフリーなマルチ球面ダイナミクスを学ぶことよりも、スロットインデックスをカリキュラムのショートカットとして活用することが示唆されている。
PFDSが$\Gframe$-不変であることを証明し、連続$\Gframe$-不変ポリシーを普遍的に近似する。
エンコーダアーキテクチャとスロットランダム化に対する2$2$のアブレーションは、アーキテクチャとデータ拡張の経路を分離し、 \PFDSは5つのランダムシードすべてにわたってシミュレーションにおいて100\%のノンドロップトランスポートを持つ5球ステージに達する。
PFDS の教師は DAgger を通じて \TactSet に蒸留し、特権付き球面状態の観察を 16$ Boolean Union のコンタクトマップに置き換え、コンパクトで自然に$\Gframe$-不変な触覚表現を与える。
関連論文リスト
- Temporal Memory for Resource-Constrained Agents: Continual Learning via Stochastic Compress-Add-Smooth [0.0]
シーケンシャルに動作するエージェントは、固定メモリ予算の下で、古い経験を忘れずに新しい経験を取り入れなければならない。
本稿では,メモリをパラメータベクトルではなくプロセスとするフレームワークを提案する。
このフレームワークは連続学習の完全な分析的イジングモデル’を提供し、数学的精度でそのメカニズム、速度、形態を研究できる。
論文 参考訳(メタデータ) (2026-03-31T12:04:11Z) - Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space [56.37266873329401]
大規模言語モデル (LLM) は、高度に一様でない情報密度を示す言語にもかかわらず、全てのトークンに一様計算を適用する。
我々は,潜在表現から意味境界を学習し,トークンから推論がより効率的である圧縮概念空間へ移行する階層型言語モデリングフレームワークである$textbfDynamic Large Concept Models (DLCM)$を提案する。
論文 参考訳(メタデータ) (2025-12-31T04:19:33Z) - Place Cells as Multi-Scale Position Embeddings: Random Walk Transition Kernels for Path Planning [43.129849610367465]
海馬は、集合的な場所細胞活動を通じて認知地図を符号化することで、空間ナビゲーションをサポートする。
この枠組みでは、内積または同値な埋め込み間のユークリッド距離は、複数のスケールにわたる遷移確率の観点から、位置間の類似性を符号化する。
非負性性と内産物構造の組み合わせは自然に空間性を誘導し、場所細胞の局所的な発火場を原則的に説明する。
論文 参考訳(メタデータ) (2025-05-20T18:14:11Z) - From Continual Learning to SGD and Back: Better Rates for Continual Linear Models [50.11453013647086]
以前見られたタスクの損失を、$k$の繰り返しの後、忘れること、すなわち、分析する。
実現可能な最小二乗の設定において、新しい最上界を創出する。
我々は、タスクを繰り返しないランダム化だけで、十分に長いタスクシーケンスで破滅的な事態を防げることを初めて証明した。
論文 参考訳(メタデータ) (2025-04-06T18:39:45Z) - Guided Patch-Grouping Wavelet Transformer with Spatial Congruence for
Ultra-High Resolution Segmentation [18.50799240622156]
GPWFormer(GPWFormer)の提案
$mathcalT$は、UHRイメージ全体を入力として取り、局所的な詳細と細かな長距離コンテキスト依存の両方を抽出する。
$mathcalC$は、カテゴリの深いコンテキストを学ぶための入力として、サンプルイメージを取ります。
論文 参考訳(メタデータ) (2023-07-03T02:19:48Z) - MixCycle: Mixup Assisted Semi-Supervised 3D Single Object Tracking with
Cycle Consistency [81.49482678098464]
3Dシングルオブジェクトトラッキング(SOT)は、自動走行の必要不可欠な部分である。
教師なし2次元SOTにおけるサイクルトラッキングの大成功に触発されて,我々は最初の半教師付きアプローチを3次元SOTに導入した。
具体的には,1) 学習の初期段階においてモデルをよりよく収束させるためにラベルを利用する自己追跡サイクル,2) 運動変動に対するトラッカーの頑健さとテンプレート更新戦略によるテンプレートノイズを補強する前向きサイクル,という2つのサイクル整合性戦略を導入する。
論文 参考訳(メタデータ) (2023-03-16T10:48:59Z) - Predicting the Stability of Hierarchical Triple Systems with
Convolutional Neural Networks [68.8204255655161]
本稿では,階層型三重項の安定性を予測する畳み込みニューラルネットワークモデルを提案する。
すべてのトレーニングされたモデルは公開されており、純粋な$N$-bodyメソッドよりも200ドルの速さで階層的な3重システムの安定性を予測することができる。
論文 参考訳(メタデータ) (2022-06-24T17:58:13Z) - Many Body Quantum Chaos and Dual Unitarity Round-a-Face [0.0]
我々は、一元的相互作用ラウンド・ア・フェイス(IRF)によって生成される新しいタイプの局所相互作用量子回路を提案する。
局所可観測物の任意の動的相関関数が有限次元完全正のトレース保存単位写像で評価できることを示す。
我々はDUBG回路のカイラル拡大の次元に関する追加データを提供し、任意の/負格子サイトに住む次元$dneq d'$の異なる局所ヒルベルト空間を持つ。
論文 参考訳(メタデータ) (2021-05-17T17:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。