論文の概要: Adapting by Analogy: OOD Generalization of Visuomotor Policies via Functional Correspondence
- arxiv url: http://arxiv.org/abs/2506.12678v1
- Date: Sun, 15 Jun 2025 01:17:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.690499
- Title: Adapting by Analogy: OOD Generalization of Visuomotor Policies via Functional Correspondence
- Title(参考訳): アナロジーによる適応: 機能的対応による覚醒剤のOOD一般化
- Authors: Pranay Gupta, Henny Admoni, Andrea Bajcsy,
- Abstract要約: In-distriion (ID) の振る舞いは、機能的類似性を ID 条件と共有するout-of-distriion (OOD) 条件に移行することができる。
我々は,この OOD-to-ID 機能対応を専門家に提供できることを提案する。
我々は,Franka Pandaロボットマニピュレータを用いて,実世界の多様なロボット操作タスクにまたがる手法を検証する。
- 参考スコア(独自算出の注目度): 10.752606286911504
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: End-to-end visuomotor policies trained using behavior cloning have shown a remarkable ability to generate complex, multi-modal low-level robot behaviors. However, at deployment time, these policies still struggle to act reliably when faced with out-of-distribution (OOD) visuals induced by objects, backgrounds, or environment changes. Prior works in interactive imitation learning solicit corrective expert demonstrations under the OOD conditions -- but this can be costly and inefficient. We observe that task success under OOD conditions does not always warrant novel robot behaviors. In-distribution (ID) behaviors can directly be transferred to OOD conditions that share functional similarities with ID conditions. For example, behaviors trained to interact with in-distribution (ID) pens can apply to interacting with a visually-OOD pencil. The key challenge lies in disambiguating which ID observations functionally correspond to the OOD observation for the task at hand. We propose that an expert can provide this OOD-to-ID functional correspondence. Thus, instead of collecting new demonstrations and re-training at every OOD encounter, our method: (1) detects the need for feedback by first checking if current observations are OOD and then identifying whether the most similar training observations show divergent behaviors, (2) solicits functional correspondence feedback to disambiguate between those behaviors, and (3) intervenes on the OOD observations with the functionally corresponding ID observations to perform deployment-time generalization. We validate our method across diverse real-world robotic manipulation tasks with a Franka Panda robotic manipulator. Our results show that test-time functional correspondences can improve the generalization of a vision-based diffusion policy to OOD objects and environment conditions with low feedback.
- Abstract(参考訳): 行動クローニングを用いて訓練されたエンド・ツー・エンドのビジュモータ・ポリシーは、複雑でマルチモーダルな低レベルロボットの動作を生成する素晴らしい能力を示している。
しかし、配備時には、オブジェクトやバックグラウンド、環境の変化によって引き起こされるアウト・オブ・ディストリビューション(OOD)の視覚に直面すると、これらのポリシーは依然として確実に振る舞うのに苦労する。
以前はインタラクティブな模倣学習で、OOD条件下での修正専門家のデモンストレーションを要請していましたが、これは費用がかかり非効率です。
我々は、OOD条件下でのタスク成功が、必ずしも新しいロボットの振る舞いを保証しているとは限らないことを観察する。
In-distriion (ID) の振る舞いは、ID条件と機能的類似性を共有する OOD 条件に直接転送することができる。
例えば、IDペンと相互作用するように訓練された行動は、視覚的にOOD鉛筆との相互作用に適用できる。
重要な課題は、どのID観察が、手元にあるタスクのOOD観測と機能的に一致するかを明確にすることである。
我々は,この OOD-to-ID 機能対応を専門家に提供できることを提案する。
そこで,本手法では,(1)現在の観測結果がOODであるかをまず確認し,最も類似した学習観察結果が相違する行動を示すかどうかを判断し,(2)機能的対応フィードバックがそれらの動作の曖昧さを判断し,(3)機能的対応したID観測とOOD観察の介入により,展開時一般化を行う。
我々は,Franka Pandaロボットマニピュレータを用いて,実世界の多様なロボット操作タスクにまたがる手法を検証する。
その結果,OODオブジェクトと環境条件に対する視覚的拡散ポリシーの一般化を低フィードバックで実現できることが示唆された。
関連論文リスト
- The Best of Both Worlds: On the Dilemma of Out-of-distribution Detection [75.65876949930258]
アウト・オブ・ディストリビューション(OOD)検出はモデル信頼性に不可欠である。
我々は,OODの一般化能力を秘かに犠牲にすることで,最先端手法のOOD検出性能が向上することを示す。
論文 参考訳(メタデータ) (2024-10-12T07:02:04Z) - Skeleton-OOD: An End-to-End Skeleton-Based Model for Robust Out-of-Distribution Human Action Detection [17.85872085904999]
そこで我々はSkeleton-OODと呼ばれる新しい骨格モデルを提案する。
Skeleton-OODは、ID認識の精度を確保しつつ、OODタスクの有効性を向上させる。
本研究は,骨格型行動認識タスクの文脈における従来のOOD検出技術の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2024-05-31T05:49:37Z) - Disentangled Interaction Representation for One-Stage Human-Object
Interaction Detection [70.96299509159981]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、人間中心の画像理解のコアタスクである。
最近のワンステージ手法では、対話予測に有用な画像ワイドキューの収集にトランスフォーマーデコーダを採用している。
従来の2段階の手法は、非絡み合いで説明可能な方法で相互作用特徴を構成する能力から大きな恩恵を受ける。
論文 参考訳(メタデータ) (2023-12-04T08:02:59Z) - OOD Aware Supervised Contrastive Learning [13.329080722482187]
アウト・オブ・ディストリビューション(OOD)検出は、機械学習モデルの安全なデプロイにおいて重要な問題である。
我々は、Supervised Contrastive (SupCon)トレーニングで学んだ強力な表現を活用し、OODデータに対する堅牢性を学ぶための総合的なアプローチを提案する。
我々の解は単純で効率的であり、閉集合教師付きコントラスト表現学習の自然な拡張として機能する。
論文 参考訳(メタデータ) (2023-10-03T10:38:39Z) - From Global to Local: Multi-scale Out-of-distribution Detection [129.37607313927458]
アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)トレーニングプロセス中にラベルが見られない未知のデータを検出することを目的としている。
近年の表現学習の進歩により,距離に基づくOOD検出がもたらされる。
グローバルな視覚情報と局所的な情報の両方を活用する第1のフレームワークであるマルチスケールOOD検出(MODE)を提案する。
論文 参考訳(メタデータ) (2023-08-20T11:56:25Z) - AUTO: Adaptive Outlier Optimization for Test-Time OOD Detection [79.51071170042972]
Out-of-Distribution (OOD) 検出は、任意のトレーニングインディストリビューション(ID)クラスに該当しないテストサンプルを検出することを目的としている。
データ安全性とプライバシにより、さまざまなシナリオに対して、事前にタスク固有の外れ値の収集が不可能になる。
テスト中にラベルのないデータストリームから実際のOODデータを利用することができる。
論文 参考訳(メタデータ) (2023-03-22T02:28:54Z) - Open-World Pose Transfer via Sequential Test-Time Adaption [92.67291699304992]
典型的なポーズ転送フレームワークは、通常、識別モデルをトレーニングするために代表的データセットを使用する。
テスト時間適応(TTA)は、自己スーパービジョンで本質的な特徴を学習する事前学習モデルを使用することで、OODデータに対して実現可能なソリューションを提供する。
実験では、まず、Tiktokの再現や有名人による動き合成など、オープンワールドの応用に、ポーズ転送が適用可能であることを示す。
論文 参考訳(メタデータ) (2023-03-20T09:01:23Z) - UniNL: Aligning Representation Learning with Scoring Function for OOD
Detection via Unified Neighborhood Learning [32.69035328161356]
我々は,OODの意図を検出するために,統一された近傍学習フレームワーク (UniNL) を提案する。
具体的には、表現学習のためのK-nearest neighbor contrastive learning(KNCL)を設計し、OOD検出のためのKNNベースのスコアリング機能を導入する。
論文 参考訳(メタデータ) (2022-10-19T17:06:34Z) - Breaking Down Out-of-Distribution Detection: Many Methods Based on OOD
Training Data Estimate a Combination of the Same Core Quantities [104.02531442035483]
本研究の目的は,OOD検出手法の暗黙的なスコアリング機能を識別すると同時に,共通の目的を認識することである。
内分布と外分布の2値差はOOD検出問題のいくつかの異なる定式化と等価であることを示す。
また, 外乱露光で使用される信頼損失は, 理論上最適のスコアリング関数と非自明な方法で異なる暗黙的なスコアリング関数を持つことを示した。
論文 参考訳(メタデータ) (2022-06-20T16:32:49Z) - Task-Driven Detection of Distribution Shifts with Statistical Guarantees
for Robot Learning [13.190581566723917]
我々のゴールは、ロボットがトレーニングに使用するものとは異なる分布から引き出された環境において、ロボットが動作していることを検知する、アウト・オブ・ディストリビューション検出を行うことである。
我々は、確率的近似(PAC)-ベイズ理論を利用して、トレーニング分布の性能を保証したポリシーを訓練する。
私たちの例では、ほんの数回の試行でタスク駆動型OOD検出を実行できることを示しています。
論文 参考訳(メタデータ) (2021-06-25T15:41:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。