論文の概要: Hyper-GoalNet: Goal-Conditioned Manipulation Policy Learning with HyperNetworks
- arxiv url: http://arxiv.org/abs/2512.00085v1
- Date: Wed, 26 Nov 2025 09:11:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.052496
- Title: Hyper-GoalNet: Goal-Conditioned Manipulation Policy Learning with HyperNetworks
- Title(参考訳): Hyper-GoalNet: HyperNetworksによるGoal-Conditioned Manipulation Policy Learning
- Authors: Pei Zhou, Wanting Yao, Qian Luo, Xunzhe Zhou, Yanchao Yang,
- Abstract要約: Hyper-GoalNetは、ハイパーネットワークを使用して目標仕様からタスク固有のポリシーネットワークパラメータを生成するフレームワークである。
本手法は,環境ランダム化の異なる総合的な操作タスク群において評価する。
その結果,最先端手法よりも優れた性能が得られた。
- 参考スコア(独自算出の注目度): 14.349465263255617
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Goal-conditioned policy learning for robotic manipulation presents significant challenges in maintaining performance across diverse objectives and environments. We introduce Hyper-GoalNet, a framework that generates task-specific policy network parameters from goal specifications using hypernetworks. Unlike conventional methods that simply condition fixed networks on goal-state pairs, our approach separates goal interpretation from state processing -- the former determines network parameters while the latter applies these parameters to current observations. To enhance representation quality for effective policy generation, we implement two complementary constraints on the latent space: (1) a forward dynamics model that promotes state transition predictability, and (2) a distance-based constraint ensuring monotonic progression toward goal states. We evaluate our method on a comprehensive suite of manipulation tasks with varying environmental randomization. Results demonstrate significant performance improvements over state-of-the-art methods, particularly in high-variability conditions. Real-world robotic experiments further validate our method's robustness to sensor noise and physical uncertainties. Code is available at: https://github.com/wantingyao/hyper-goalnet.
- Abstract(参考訳): ロボット操作のための目標条件付きポリシー学習は、様々な目的や環境におけるパフォーマンスを維持する上で大きな課題となる。
ハイパーネットを用いた目標仕様からタスク固有のポリシネットワークパラメータを生成するフレームワークであるHyper-GoalNetを紹介する。
ゴール状態ペアに固定されたネットワークを単純に条件付けする従来の手法とは異なり、我々の手法はゴールの解釈を状態処理から切り離す -- 前者はネットワークパラメータを決定し、後者は現在の観測にこれらのパラメータを適用します。
効果的な政策生成のための表現品質を高めるために,(1)状態遷移予測性を促進するフォワードダイナミクスモデル,(2)ゴール状態に対するモノトニックな進行を保証する距離ベース制約の2つの制約を実装した。
本手法は,環境ランダム化の異なる総合的な操作タスク群において評価する。
その結果、特に高可変条件下では、最先端手法よりも顕著な性能向上が見られた。
実世界のロボット実験は、センサノイズと物理的不確実性に対する我々の方法の堅牢性をさらに検証する。
コードは、https://github.com/wantingyao/hyper-goalnet.comで入手できる。
関連論文リスト
- Efficient Virtuoso: A Latent Diffusion Transformer Model for Goal-Conditioned Trajectory Planning [0.0]
本稿では,目標条件付き軌道計画のための条件付き潜在拡散モデルであるEfficient Virtuosoを提案する。
提案手法は,Open Motionデータセット上での最先端性能を実現し,平均変位誤差(minADE)が0.25であることを示す。
一つのゴールが戦略的曖昧さを解決できる一方で、人間の運転行動を反映した正確で忠実な戦術実行を実現するためには、よりリッチで多段階のスパース経路が不可欠である。
論文 参考訳(メタデータ) (2025-09-03T19:18:02Z) - Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy [73.75271615101754]
本稿では,Transformerアーキテクチャを活用した拡張性のあるフレームワークであるDitaについて紹介する。
Ditaはコンテキスト内コンディショニング(context conditioning)を採用しており、歴史的観察から生の視覚トークンと識別されたアクションをきめ細やかなアライメントを可能にする。
Ditaは、さまざまなカメラパースペクティブ、観察シーン、タスク、アクションスペースの横断的なデータセットを効果的に統合する。
論文 参考訳(メタデータ) (2025-03-25T15:19:56Z) - Diffusion Transformer Policy [48.50988753948537]
本稿では,拡散変圧器ポリシー(Diffusion Transformer Policy)と呼ばれる多モード拡散変圧器を提案し,連続的なエンドエフェクタ動作をモデル化する。
トランスのスケーリング機能を活用することで、提案手法は、多種多様なロボットデータセットにわたる継続的エンドエフェクタアクションを効果的にモデル化することができる。
論文 参考訳(メタデータ) (2024-10-21T12:43:54Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z) - Probabilistic Reach-Avoid for Bayesian Neural Networks [71.67052234622781]
最適合成アルゴリズムは、証明された状態の数を4倍以上に増やすことができることを示す。
このアルゴリズムは、平均的な到達回避確率を3倍以上に向上させることができる。
論文 参考訳(メタデータ) (2023-10-03T10:52:21Z) - Bilinear value networks [16.479582509493756]
両線形分解方式はデータ効率を大幅に向上させ, 分配目標への転送に優れることを示す。
シミュレーションされたFetchロボットのタスクスーツとシャドウハンドによる巧妙な操作に関する実証的証拠が提供される。
論文 参考訳(メタデータ) (2022-04-28T17:58:48Z) - Model-Free Learning of Optimal Deterministic Resource Allocations in
Wireless Systems via Action-Space Exploration [4.721069729610892]
本稿では,最適パラメータ化資源割り当てポリシーを効率的に学習するための,技術的基盤と拡張性のある2次元勾配法を提案する。
提案手法は, 深層ネットワークなどの一般的な普遍表現の勾配を効率よく活用するだけでなく, 低次元摂動により構築された関連するランダムネットワークサービスのゼロ階勾配近似を一貫したゼロ階勾配近似に頼っているため, 真のモデルフリーである。
論文 参考訳(メタデータ) (2021-08-23T18:26:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。