論文の概要: BOSS: Benchmark for Observation Space Shift in Long-Horizon Task
- arxiv url: http://arxiv.org/abs/2502.15679v1
- Date: Fri, 21 Feb 2025 18:58:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 16:10:15.427007
- Title: BOSS: Benchmark for Observation Space Shift in Long-Horizon Task
- Title(参考訳): BOSS: 長期タスクにおける観測空間シフトのベンチマーク
- Authors: Yue Yang, Linfeng Zhao, Mingyu Ding, Gedas Bertasius, Daniel Szafir,
- Abstract要約: 観測空間シフト(OSS)は、観測空間のシフトを引き起こし、スキルポリシーのパフォーマンスを損なう。
BOSSは、"Single Predicate Shift"、"Accumulated Predicate Shift"、"Skill Chaining"の3つの異なる課題で構成されている。
最も単純な課題であっても、OSSと比較してスキルパフォーマンスを比較すると、平均的なパフォーマンス低下は67%、35%、34%、54%でした。
- 参考スコア(独自算出の注目度): 41.7174170248258
- License:
- Abstract: Robotics has long sought to develop visual-servoing robots capable of completing previously unseen long-horizon tasks. Hierarchical approaches offer a pathway for achieving this goal by executing skill combinations arranged by a task planner, with each visuomotor skill pre-trained using a specific imitation learning (IL) algorithm. However, even in simple long-horizon tasks like skill chaining, hierarchical approaches often struggle due to a problem we identify as Observation Space Shift (OSS), where the sequential execution of preceding skills causes shifts in the observation space, disrupting the performance of subsequent individually trained skill policies. To validate OSS and evaluate its impact on long-horizon tasks, we introduce BOSS (a Benchmark for Observation Space Shift). BOSS comprises three distinct challenges: "Single Predicate Shift", "Accumulated Predicate Shift", and "Skill Chaining", each designed to assess a different aspect of OSS's negative effect. We evaluated several recent popular IL algorithms on BOSS, including three Behavioral Cloning methods and the Visual Language Action model OpenVLA. Even on the simplest challenge, we observed average performance drops of 67%, 35%, 34%, and 54%, respectively, when comparing skill performance with and without OSS. Additionally, we investigate a potential solution to OSS that scales up the training data for each skill with a larger and more visually diverse set of demonstrations, with our results showing it is not sufficient to resolve OSS. The project page is: https://boss-benchmark.github.io/
- Abstract(参考訳): ロボティクスは長い間、これまで見たことのないロングホライゾンタスクを完了できるビジュアルサーボロボットの開発を模索してきた。
階層的なアプローチは、タスクプランナーが配置したスキルの組み合わせを実行し、特定の模倣学習(IL)アルゴリズムを使用して、各ビズモータスキルを事前訓練することで、この目標を達成するための経路を提供する。
しかし、スキルチェーンのような単純なロングホライゾンタスクにおいても、先行するスキルの逐次実行が観察空間のシフトを引き起こし、その後の個別に訓練されたスキルポリシーのパフォーマンスを損なうような、観察空間シフト(OSS)と呼ばれる問題によって、階層的なアプローチがしばしば苦労する。
OSSを検証し、長期タスクへの影響を評価するため、BOSS(観測空間シフトベンチマーク)を紹介する。
BOSSには、“Single Predicate Shift”、“Accumulated Predicate Shift”、“Skill Chaining”という3つの課題がある。
BOSS上での最近の人気のあるILアルゴリズムの評価には,3つの行動クローン法とVisual Language Action Model OpenVLAがある。
最も単純な課題であっても、OSSと比較してスキルパフォーマンスを比較すると、平均的なパフォーマンス低下は67%、35%、34%、54%でした。
さらに、OSSの潜在的なソリューションとして、より大きく、より視覚的に多様なデモセットを用いて、各スキルのトレーニングデータをスケールアップする可能性について検討し、OSSを解決するには不十分であることを示す。
プロジェクトページは以下の通り。
関連論文リスト
- Bootstrap Your Own Skills: Learning to Solve New Tasks with Large
Language Model Guidance [66.615355754712]
BOSSが"スキルブートストラップ"を実行して新しいタスクを達成
LLM誘導型ブートストラップ法で訓練されたエージェントは,実生活環境における実測実験により,ナイーブなブートストラップ法で訓練されたエージェントよりも優れていた。
論文 参考訳(メタデータ) (2023-10-16T02:43:47Z) - UniFormaly: Towards Task-Agnostic Unified Framework for Visual Anomaly
Detection [6.260747047974035]
We present UniFormaly, a universal and powerful anomaly detection framework。
我々は,オンラインエンコーダ方式の準最適問題を指摘することによって,オフ・ザ・シェルフアプローチの必要性を強調した。
UniFormalyは様々なタスクやデータセットで優れた結果を得る。
論文 参考訳(メタデータ) (2023-07-24T06:04:12Z) - Multi-Level Contrastive Learning for Dense Prediction Task [59.591755258395594]
本稿では,高密度予測タスクのための領域レベルの特徴表現を効率よく学習するための,MCL(Multi-Level Contrastive Learning for Dense Prediction Task)を提案する。
本手法は, 局所化, スケールの整合性, 認識の3つの要因に動機付けられている。
提案手法は,様々なデータセットにおける最近の最先端の手法よりも有意なマージンを有する。
論文 参考訳(メタデータ) (2023-04-04T17:59:04Z) - Planning for Sample Efficient Imitation Learning [52.44953015011569]
現在の模倣アルゴリズムは、高い性能と高環境サンプル効率を同時に達成するのに苦労している。
本研究では,環境内サンプルの効率と性能を同時に達成できる計画型模倣学習手法であるEfficientImitateを提案する。
実験結果から,EIは性能と試料効率の両立を図った。
論文 参考訳(メタデータ) (2022-10-18T05:19:26Z) - Task Compass: Scaling Multi-task Pre-training with Task Prefix [122.49242976184617]
既存の研究では、大規模教師付きタスクによるマルチタスク学習がタスク間の負の効果に悩まされていることが示されている。
タスク間の関係を探索するために,タスクプレフィックスガイド付きマルチタスク事前学習フレームワークを提案する。
我々のモデルは、幅広いタスクの強力な基盤バックボーンとして機能するだけでなく、タスク関係を分析するための探索ツールとしても実現可能である。
論文 参考訳(メタデータ) (2022-10-12T15:02:04Z) - Cerberus Transformer: Joint Semantic, Affordance and Attribute Parsing [9.321541170038122]
我々は, 共同意味論, 余裕, 属性解析の新たな課題に取り組む。
我々は、Cerberusという名前の注意に基づくアーキテクチャと、カスタマイズされたトレーニングフレームワークを提案する。
本手法は上記の課題に効果的に対処し、3つの課題すべてに対して最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-11-24T16:32:15Z) - Automated Self-Supervised Learning for Graphs [37.14382990139527]
本研究の目的は、複数のプリテキストタスクを効果的に活用する方法を検討することである。
我々は、多くの実世界のグラフ、すなわちホモフィリーの鍵となる原理を、様々な自己教師付きプレテキストタスクを効果的に探索するためのガイダンスとして利用している。
本稿では,自己教師型タスクの組み合わせを自動的に検索するAutoSSLフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-10T03:09:20Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z) - Combat Data Shift in Few-shot Learning with Knowledge Graph [42.59886121530736]
現実世界のアプリケーションでは、少数ショットの学習パラダイムはデータシフトに悩まされることが多い。
既存の少数ショット学習アプローチのほとんどは、データシフトを考慮して設計されていない。
本稿では,タスク固有表現とタスク共有表現を抽出するメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-27T12:35:18Z) - Conditional Channel Gated Networks for Task-Aware Continual Learning [44.894710899300435]
畳み込みニューラルネットワークは、一連の学習問題に最適化された場合、破滅的な忘れを経験する。
本稿では,この問題に条件付き計算で対処する新しい枠組みを提案する。
提案手法を4つの連続学習データセットで検証する。
論文 参考訳(メタデータ) (2020-03-31T19:35:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。