論文の概要: AdaTracker: Learning Adaptive In-Context Policy for Cross-Embodiment Active Visual Tracking
- arxiv url: http://arxiv.org/abs/2604.20305v1
- Date: Wed, 22 Apr 2026 08:06:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.030151
- Title: AdaTracker: Learning Adaptive In-Context Policy for Cross-Embodiment Active Visual Tracking
- Title(参考訳): AdaTracker: 組織横断型アクティブビジュアルトラッキングのための適応型インコンテキストポリシーの学習
- Authors: Kui Wu, Hao Chen, Jinzhu Han, Haijun Liu, Churan Wang, Yizhou Wang, Zhoujun Li, Si Liu, Fangwei Zhong,
- Abstract要約: 既存のアプローチは通常、各実施形態の別々のモデルを訓練し、スケーラビリティの低下と限定的な一般化をもたらす。
AdaTrackerは、多様なロボット形態に基づいて、ターゲットをしっかりと追跡する適応型インコンテキストポリシー学習フレームワークである。
シミュレーションと実世界の双方の実験により、AdaTrackerはクロスボデーメントの一般化、サンプル効率、ゼロショット適応において最先端の手法を大幅に上回っていることが示された。
- 参考スコア(独自算出の注目度): 42.310377711916104
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Realizing active visual tracking with a single unified model across diverse robots is challenging, as the physical constraints and motion dynamics vary drastically from one platform to another. Existing approaches typically train separate models for each embodiment, leading to poor scalability and limited generalization. To address this, we propose AdaTracker, an adaptive in-context policy learning framework that robustly tracks targets on diverse robot morphologies. Our key insight is to explicitly model embodiment-specific constraints through an Embodiment Context Encoder, which infers embodiment-specific constraints from history. This contextual representation dynamically modulates a Context-Aware Policy, enabling it to infer optimal control actions for unseen embodiments in a zero-shot manner. To enhance robustness, we introduce two auxiliary objectives to ensure accurate context identification and temporal consistency. Experiments in both simulation and the real world demonstrate that AdaTracker significantly outperforms state-of-the-art methods in cross-embodiment generalization, sample efficiency, and zero-shot adaptation.
- Abstract(参考訳): 多様なロボットにまたがる単一の統一モデルでアクティブな視覚的トラッキングを実現することは、物理的な制約や動きのダイナミクスがプラットフォームによって大きく異なるため、困難である。
既存のアプローチは通常、各実施形態の別々のモデルを訓練し、スケーラビリティの低下と限定的な一般化をもたらす。
そこで本研究では,多種多様なロボット形態のターゲットを頑健に追跡する適応型インコンテキストポリシー学習フレームワークであるAdaTrackerを提案する。
我々の重要な洞察は、エボディメント固有の制約を、エボディメント固有の制約を歴史から推論するエンコーダを通じて明示的にモデル化することである。
この文脈表現はコンテキスト認識ポリシーを動的に変調し、ゼロショット方式で見えない実施物に対して最適な制御アクションを推論することを可能にする。
強靭性を高めるため,文脈の正確な識別と時間的整合性を確保するために2つの補助的目的を導入する。
シミュレーションと実世界の双方での実験では、AdaTrackerはクロスボデーメントの一般化、サンプル効率、ゼロショット適応において最先端の手法を著しく上回っている。
関連論文リスト
- MOTIF: Learning Action Motifs for Few-shot Cross-Embodiment Transfer [55.982504915794514]
クロス・エボディメント・ポリシーは一般的に共有プライベート・アーキテクチャに依存している。
本報告では,MOTIFを効率よく数発のクロスボディーメントトランスファーに適用する。
我々はMOTIFが数発の転送シナリオにおいて強いベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2026-02-14T13:21:40Z) - AdaMorph: Unified Motion Retargeting via Embodiment-Aware Adaptive Transformers [49.796014934503184]
本研究では、単一モデルで多様なロボット形態に人間の動きを適応させることができる統一型ニューラルネットワークフレームワークを提案する。
12個の異なるヒューマノイドロボットの実験結果から、AdaMorphが異種トポロジにわたって効果的に制御できることが示されている。
論文 参考訳(メタデータ) (2026-01-12T07:39:38Z) - Joint Flow Trajectory Optimization For Feasible Robot Motion Generation from Video Demonstrations [8.133207162076877]
本稿では,LfD(Learning-from-Demonstration)パラダイムに基づくポーズ生成とオブジェクトの軌道模倣を把握するためのフレームワークを提案する。
人間の手の動きを直接模倣するのではなく,実演を対象中心のガイドとして扱う。
我々は,様々な実世界の操作タスクにおけるシミュレーションと実世界の実験の両方において,我々のアプローチを検証する。
論文 参考訳(メタデータ) (2025-09-25T03:11:07Z) - TrackVLA: Embodied Visual Tracking in the Wild [34.03604806748204]
Embodied visual trackingは、Embodied AIの基本的なスキルであり、エージェントは、自我中心の視覚のみを使用して、動的環境における特定のターゲットに従うことができる。
既存のアプローチは通常、認識と計画のモジュラー分離を通じてこの問題に対処する。
本研究では,物体認識と軌道計画の相乗効果を学習する視覚・言語・行動モデルであるTrackVLAを提案する。
論文 参考訳(メタデータ) (2025-05-29T07:28:09Z) - Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy [73.75271615101754]
本稿では,Transformerアーキテクチャを活用した拡張性のあるフレームワークであるDitaについて紹介する。
Ditaはコンテキスト内コンディショニング(context conditioning)を採用しており、歴史的観察から生の視覚トークンと識別されたアクションをきめ細やかなアライメントを可能にする。
Ditaは、さまざまなカメラパースペクティブ、観察シーン、タスク、アクションスペースの横断的なデータセットを効果的に統合する。
論文 参考訳(メタデータ) (2025-03-25T15:19:56Z) - Diffusion Transformer Policy [48.50988753948537]
本稿では,拡散変圧器ポリシー(Diffusion Transformer Policy)と呼ばれる多モード拡散変圧器を提案し,連続的なエンドエフェクタ動作をモデル化する。
トランスのスケーリング機能を活用することで、提案手法は、多種多様なロボットデータセットにわたる継続的エンドエフェクタアクションを効果的にモデル化することができる。
論文 参考訳(メタデータ) (2024-10-21T12:43:54Z) - ReCoRe: Regularized Contrastive Representation Learning of World Model [21.29132219042405]
対照的な教師なし学習と介入不変正規化器を用いて不変特徴を学習する世界モデルを提案する。
提案手法は,現状のモデルベースおよびモデルフリーのRL法より優れ,iGibsonベンチマークで評価された分布外ナビゲーションタスクを大幅に改善する。
論文 参考訳(メタデータ) (2023-12-14T15:53:07Z) - Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot
Dynamics and Environments [3.5309638744466167]
この研究は、ロバストな移動のための異なる条件に制御ポリシーを適応させるメタラーニングアプローチを開発した。
提案手法は, インタラクションモデルを更新し, 推定された状態-作用軌道のアクションをサンプル化し, 最適なアクションを適用し, 報酬を最大化する。
論文 参考訳(メタデータ) (2021-01-19T12:57:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。