論文の概要: One-shot Visual Imitation via Attributed Waypoints and Demonstration
Augmentation
- arxiv url: http://arxiv.org/abs/2302.04856v1
- Date: Thu, 9 Feb 2023 18:56:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-10 14:41:21.701625
- Title: One-shot Visual Imitation via Attributed Waypoints and Demonstration
Augmentation
- Title(参考訳): 分散視点とデモ拡張によるワンショット視覚模倣
- Authors: Matthew Chang, Saurabh Gupta
- Abstract要約: 一発の視覚的模倣では、エージェントは1つの視覚的デモンストレーションだけを与えられた新しいタスクのインスタンスを解決しなければならない。
分析の結果, DAgger問題の原因は, 純粋なオフライントレーニング, オブジェクトとのインタラクションにおける最終センチメートル誤差, 実際のタスクではなくタスクコンテキストに不適合であることがわかった。
我々のモデルは、最近の2つのベンチマークで100%と48%の成功率を獲得し、それぞれ90%と20%の改善を実現しています。
- 参考スコア(独自算出の注目度): 14.391752643263725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we analyze the behavior of existing techniques and design new
solutions for the problem of one-shot visual imitation. In this setting, an
agent must solve a novel instance of a novel task given just a single visual
demonstration. Our analysis reveals that current methods fall short because of
three errors: the DAgger problem arising from purely offline training, last
centimeter errors in interacting with objects, and mis-fitting to the task
context rather than to the actual task. This motivates the design of our
modular approach where we a) separate out task inference (what to do) from task
execution (how to do it), and b) develop data augmentation and generation
techniques to mitigate mis-fitting. The former allows us to leverage
hand-crafted motor primitives for task execution which side-steps the DAgger
problem and last centimeter errors, while the latter gets the model to focus on
the task rather than the task context. Our model gets 100% and 48% success
rates on two recent benchmarks, improving upon the current state-of-the-art by
absolute 90% and 20% respectively.
- Abstract(参考訳): 本稿では,既存の手法の挙動を分析し,ワンショット視覚模倣問題に対する新しい解決策を設計する。
この設定では、エージェントは単一の視覚的なデモンストレーションだけを与えられた新しいタスクのインスタンスを解決しなければならない。
分析の結果,DAgger問題,オブジェクトとのインタラクションにおける最終センチメートル誤差,実際のタスクではなくタスクコンテキストへの不適合という3つの誤りが原因で,現在の手法が不足していることが判明した。
このことがモジュラー・アプローチの設計を動機付けます
a)タスクの実行からタスク推論(何をすべきか)を分離し、
b)ミスフィッティングを緩和するためにデータ拡張および生成技術を開発すること。
前者はタスクの実行に手作りのモータープリミティブを活用でき、後者はタスクコンテキストではなくタスクに集中することができます。
我々のモデルは、最近の2つのベンチマークで100%と48%の成功率を獲得し、それぞれ90%と20%の改善を実現しています。
関連論文リスト
- Task-Adapter: Task-specific Adaptation of Image Models for Few-shot Action Recognition [34.88916568947695]
簡単なタスク固有適応法(Task-Adapter)を提案する。
提案したTask-Adapterをバックボーンの最後のいくつかのレイヤに導入することで、フル微調整によるオーバーフィッティング問題を軽減します。
実験結果から,提案したタスクアダプタが標準の4つのアクション認識データセットに対して有効であることを示す。
論文 参考訳(メタデータ) (2024-08-01T03:06:56Z) - DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。
この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。
実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文 参考訳(メタデータ) (2024-06-06T18:12:04Z) - Localizing Task Information for Improved Model Merging and Compression [61.16012721460561]
我々は,各タスクの重み付けが重なり合わないことが多いため,各タスクがマージされた後も,各タスクの解決に必要な情報が保存されていることを示す。
本稿では,そのような重みを排除し,既存のモデルマージ手法の一般的な性能を改善するアルゴリズムであるConsensus Mergingを提案する。
論文 参考訳(メタデータ) (2024-05-13T14:54:37Z) - Data-CUBE: Data Curriculum for Instruction-based Sentence Representation
Learning [85.66907881270785]
本稿では,学習用マルチタスクデータの順序を列挙するデータカリキュラム,すなわちData-CUBEを提案する。
タスクレベルでは、タスク間の干渉リスクを最小化するために最適なタスクオーダーを見つけることを目的としている。
インスタンスレベルでは、タスク毎のすべてのインスタンスの難易度を測定し、トレーニングのためにそれらを簡単に微分できるミニバッチに分割します。
論文 参考訳(メタデータ) (2024-01-07T18:12:20Z) - ForkMerge: Mitigating Negative Transfer in Auxiliary-Task Learning [59.08197876733052]
補助タスク学習(ATL)は、関連するタスクから得られる知識を活用することにより、目標タスクの性能を向上させることを目的としている。
複数のタスクを同時に学習すると、ターゲットタスクのみを学習するよりも精度が低下することがある。
ForkMergeは、モデルを定期的に複数のブランチにフォークし、タスクの重みを自動的に検索する新しいアプローチである。
論文 参考訳(メタデータ) (2023-01-30T02:27:02Z) - TIDo: Source-free Task Incremental Learning in Non-stationary
Environments [0.0]
モデルベースのエージェントを更新して新しいターゲットタスクを学習するには、過去のトレーニングデータを格納する必要があります。
ラベル付きターゲットデータセットの制限を克服するタスクインクリメンタル学習手法はほとんどない。
本研究では,非定常的および目標的タスクに適応可能なワンショットタスクインクリメンタル学習手法を提案する。
論文 参考訳(メタデータ) (2023-01-28T02:19:45Z) - Voting from Nearest Tasks: Meta-Vote Pruning of Pre-trained Models for
Downstream Tasks [55.431048995662714]
我々は、類似タスクの刈り取られたモデルから、新しいタスクのための小さなモデルを作成する。
このモデルに関するいくつかの微調整ステップは、新しいタスクに対して有望なプルーンドモデルを生成するのに十分であることを示す。
我々は, 単純だが効果的な'Meta-Vote Pruning (MVP)' 手法を開発した。
論文 参考訳(メタデータ) (2023-01-27T06:49:47Z) - Uni-Perceiver: Pre-training Unified Architecture for Generic Perception
for Zero-shot and Few-shot Tasks [73.63892022944198]
我々はUni-Perceiverという汎用認識アーキテクチャを提案する。
様々なモダリティやタスクを、統一されたモデリングと共有パラメータで処理します。
その結果、チューニングなしで事前学習したモデルは、新しいタスクでも合理的なパフォーマンスを達成できることがわかった。
論文 参考訳(メタデータ) (2021-12-02T18:59:50Z) - Meta-Regularization by Enforcing Mutual-Exclusiveness [0.8057006406834467]
本稿では,メタ学習時の情報フローをモデル設計者が制御できるように,メタ学習モデルの正規化手法を提案する。
提案した正規化関数は,Omniglotデータセット上で$sim$$36%の精度向上を示す。
論文 参考訳(メタデータ) (2021-01-24T22:57:19Z) - Assisting Scene Graph Generation with Self-Supervision [21.89909688056478]
本稿では,3つの新しい自己スーパービジョンタスクのセットを提案し,それらをメインモデルへの補助的マルチタスクとして訓練する。
比較しながら、これらのセルフスーパービジョンタスクでベースモデルをスクラッチからトレーニングし、すべてのメトリクスとリコール設定で最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-08-08T16:38:03Z) - Conditional Channel Gated Networks for Task-Aware Continual Learning [44.894710899300435]
畳み込みニューラルネットワークは、一連の学習問題に最適化された場合、破滅的な忘れを経験する。
本稿では,この問題に条件付き計算で対処する新しい枠組みを提案する。
提案手法を4つの連続学習データセットで検証する。
論文 参考訳(メタデータ) (2020-03-31T19:35:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。