論文の概要: Riding the Shifting Potential: When Reactive Control Suffices for Multi-Goal Behavior
- arxiv url: http://arxiv.org/abs/2605.27314v1
- Date: Tue, 26 May 2026 17:24:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.494136
- Title: Riding the Shifting Potential: When Reactive Control Suffices for Multi-Goal Behavior
- Title(参考訳): シフト電位の乗り越え:マルチゴール動作に反応制御が十分である場合
- Authors: Vito Mengers, Oliver Brock,
- Abstract要約: 私たちは、現在の目的がどうあるのかを反映できないエンコーディングを活用しています。
競合がnull空間を拡張することによって相互作用する2つの領域でこれを実証する。
同じ定式化は、制御を付加した本物のロボットに直接転送する。
- 参考スコア(独自算出の注目度): 7.648784748888186
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Reactive control is often considered insufficient for multi-objective tasks because conflicting objectives give rise to local minima. We argue this limitation is not inherent but arises from static encodings that fail to reflect how objectives currently interact. We exploit the interaction structure encoded in a graph-based world model by extending it with nullspace projections: conflicts are resolved where they arise by projecting lower-priority gradients into the nullspace of higher-priority ones, with priorities determined continuously from the current state. We demonstrate this in two domains where conflicts between objectives are central: navigation around non-convex obstacles, where static potential fields fundamentally fail, and planar pushing of non-convex objects, where our method achieves $100\%$ success across one-hundred configurations versus $0\%$ for the steepest-descent baseline and ${\sim}55\%$ for diffusion policy, without demonstrations or retraining. The same formulation transfers directly to a real robot with additional perceptual and kinematic constraints, accommodating them through the same mechanism.
- Abstract(参考訳): 反応制御は、対立する目的が局所的なミニマを生じさせるため、多目的タスクには不十分であると考えられていることが多い。
この制限は固有のものではなく、目的が現在どのように相互作用しているかを反映しない静的エンコーディングから生じるものだ、と私たちは主張する。
我々は、グラフベースの世界モデルで符号化された相互作用構造を利用して、それをヌルスペース射影で拡張する: 衝突は、低優先度勾配を高優先度勾配のヌル空間に投影することで、現在の状態から連続的に決定して解決する。
静的ポテンシャル場が基本的に失敗する非凸障害物の周囲のナビゲーションと、非凸オブジェクトの平面的なプッシュという2つの領域において、この2つの領域において、我々の手法は、最も急勾配のベースラインに対して100 %の成功を達成し、最も急勾配なベースラインに対して0 %の損失を、デモンストレーションや再訓練なしに、拡散ポリシーに対して${\sim}55 %の損失を達成している。
同じ定式化は、知覚的および運動的制約を付加した実際のロボットに直接転送し、それらを同じメカニズムで調節する。
関連論文リスト
- Beyond Waypoints: Dual-Heatmap Grounding for Cross-Embodiment Semantic Navigation [13.081539889943906]
本研究では,FOV内セマンティックナビゲーションの実践的な設定に焦点を当てる。
本稿では,Dual-Heatmap表現に有利な単一点回帰を放棄する統合ビジョン・ランゲージフレームワークを提案する。
本フレームワークは,8Bベースライン間の最先端性能を実現する。
論文 参考訳(メタデータ) (2026-05-19T06:12:59Z) - Learning Reactive Dexterous Grasping via Hierarchical Task-Space RL Planning and Joint-Space QP Control [50.28263951510334]
本稿では,リアクティブなデクスタリーグルーピングのためのハイブリッド階層型制御フレームワークを提案する。
提案手法は,低レベル共同実行から高レベル空間意図を明示的に分離する。
我々は厳密なシミュレーションと現実のパイプラインを通して提案したフレームワークを広範囲に検証する。
論文 参考訳(メタデータ) (2026-05-05T04:49:38Z) - ANCHOR: A Physically Grounded Closed-Loop Framework for Robust Home-Service Mobile Manipulation [10.278758849939917]
本稿では,シンボル推論と物理状態の検証を行うクローズドループフレームワークANCHORを提案する。
ANCHORはタスクの成功率を53.3%から71.7%に改善し、摂動下での回復率は71.4%に達する。
論文 参考訳(メタデータ) (2026-04-28T07:37:39Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - Position: General Alignment Has Hit a Ceiling; Edge Alignment Must Be Taken Seriously [51.03213216886717]
我々は、一般的なアライメントの支配的なパラダイムが、矛盾する値の設定において構造的な天井に達するという立場を取る。
エッジアライメント(Edge Alignment)は,多次元の値構造を保持するシステムにおいて,異なるアプローチである。
論文 参考訳(メタデータ) (2026-02-23T16:51:43Z) - HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model [56.4392302336014]
本稿では,外部状態推定を伴わない多種多様なオブジェクトダイナミクス間のロバストな相互作用のためのフレームワークであるHAICを提案する。
我々の重要な貢献は、主観的歴史のみから高次対象状態(速度、加速度)を推定するダイナミクス予測器である。
ヒューマノイドロボットの実験では、HAICはアジャイルタスクで高い成功率を達成する。
論文 参考訳(メタデータ) (2026-02-12T09:34:35Z) - Domain Expansion: A Latent Space Construction Framework for Multi-Task Learning [26.322513515274764]
複数の目的を持つ単一ネットワークのトレーニングは、共有表現を低下させる矛盾する勾配につながることが多い。
このフレームワークは、潜伏空間自体を再構築することで、これらの衝突を防ぐ。
論文 参考訳(メタデータ) (2026-01-27T21:30:21Z) - Mastering Diverse, Unknown, and Cluttered Tracks for Robust Vision-Based Drone Racing [22.63301233637327]
ドローンレースの目標を固定した障害物のないトラックの強化学習手法のほとんどは、未知の乱雑な環境に一般化を残したままであった。
この課題は、レース速度と衝突回避のバランスをとる必要があること、限られた実現可能な空間が、訓練中に地元のオプティマに閉じ込められた政策探索を引き起こすことに起因している。
高速飛行のための政策探索を継続する初期ソフトコリデーショントレーニングフェーズと、堅牢な障害物回避を強制するハードコリデーション改善フェーズの2段階学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-10T12:02:48Z) - Null Counterfactual Factor Interactions for Goal-Conditioned Reinforcement Learning [22.778380035995127]
Hindsight relabelingは、目標条件付き強化学習において、スパーシリティを克服するための強力なツールである。
我々は、下流RLのサンプル効率を向上させるために、後向きのラベリングと相互作用を組み合わせたインタラクション(HInt)を導入する。
論文 参考訳(メタデータ) (2025-05-06T04:32:47Z) - On Generating Transferable Targeted Perturbations [102.3506210331038]
伝達性の高い標的摂動に対する新しい生成的アプローチを提案する。
私たちのアプローチは、ターゲットクラスの「乱れた画像分布」にマッチし、高いターゲット転送率につながります。
論文 参考訳(メタデータ) (2021-03-26T17:55:28Z) - Offline Contextual Bandits with Overparameterized Models [52.788628474552276]
オフラインの文脈的盗賊にも同じ現象が起こるかどうかを問う。
この相違は, 目的の強調安定性によるものであることを示す。
大規模なニューラルネットワークを用いた実験では、アクション安定な値ベース目標と不安定なポリシベース目標とのギャップは、大きなパフォーマンス差をもたらす。
論文 参考訳(メタデータ) (2020-06-27T13:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。