論文の概要: Multi-Instance Aware Localization for End-to-End Imitation Learning
- arxiv url: http://arxiv.org/abs/2101.01053v1
- Date: Sat, 26 Dec 2020 08:23:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 01:06:18.555342
- Title: Multi-Instance Aware Localization for End-to-End Imitation Learning
- Title(参考訳): エンド・ツー・エンドの模倣学習のためのマルチインスタンスアウェアローカライゼーション
- Authors: Sagar Gubbi Venkatesh and Raviteja Upadrashta and Shishir Kolathaya
and Bharadwaj Amrutur
- Abstract要約: イメージ・トゥ・アクション・ポリシ・ネットワークを用いた模擬学習の既存のアーキテクチャは、関心のあるオブジェクトの複数のインスタンスを含む入力画像を提示すると、うまく機能しない。
a) ビジュアライゼーション層の機能マップ出力をインスタンスの好みを示す埋め込みで付加し、(b) 自己回帰アクションジェネレータネットワークを制御層に採用することにより、エンドツーエンドのポリシネットワークをサンプル的に効率的にトレーニングできることを示す。
- 参考スコア(独自算出の注目度): 1.1797787239802762
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Existing architectures for imitation learning using image-to-action policy
networks perform poorly when presented with an input image containing multiple
instances of the object of interest, especially when the number of expert
demonstrations available for training are limited. We show that end-to-end
policy networks can be trained in a sample efficient manner by (a) appending
the feature map output of the vision layers with an embedding that can indicate
instance preference or take advantage of an implicit preference present in the
expert demonstrations, and (b) employing an autoregressive action generator
network for the control layers. The proposed architecture for localization has
improved accuracy and sample efficiency and can generalize to the presence of
more instances of objects than seen during training. When used for end-to-end
imitation learning to perform reach, push, and pick-and-place tasks on a real
robot, training is achieved with as few as 15 expert demonstrations.
- Abstract(参考訳): イメージ・ツー・アクション・ポリシー・ネットワークを用いた模倣学習の既存のアーキテクチャは、興味のある対象の複数のインスタンスを含む入力画像が提示された場合、特に訓練に利用可能な専門家のデモ数が限られている場合、性能が低下する。
a) 視覚層の特徴マップ出力に、例の好みを示すような埋め込みや、専門家のデモに存在する暗黙の嗜好を活用できる埋め込みを付加し、(b) 制御層に自己回帰行動生成ネットワークを用いることで、エンドツーエンドのポリシーネットワークを効率的にトレーニングできることが示される。
ローカライゼーションのためのアーキテクチャは精度とサンプル効率を向上し、トレーニング中に見るよりも多くのオブジェクトの存在を一般化することができる。
エンド・ツー・エンドの模倣学習で実際のロボットでリーチ、プッシュ、ピック・アンド・プレイスのタスクを実行する場合、トレーニングは15のエキスパート・デモで達成される。
関連論文リスト
- Flex: End-to-End Text-Instructed Visual Navigation with Foundation Models [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly-lexically) で合成され,VLM(Vision Language Models) をフリーズしたパッチワイド特徴抽出器として利用するフレームワークである。
本研究では,本手法が4段階のフライ・トゥ・ターゲットタスクにおいて有効であることを示す。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Structure-Guided Image Completion with Image-level and Object-level Semantic Discriminators [97.12135238534628]
複雑な意味論やオブジェクトの生成を改善するために,セマンティック・ディミネータとオブジェクトレベル・ディミネータからなる学習パラダイムを提案する。
特に、セマンティック・ディミネーターは、事前学習された視覚的特徴を利用して、生成された視覚概念の現実性を改善する。
提案手法は, 生成品質を著しく向上させ, 各種タスクの最先端化を実現する。
論文 参考訳(メタデータ) (2022-12-13T01:36:56Z) - The Multiple Subnetwork Hypothesis: Enabling Multidomain Learning by
Isolating Task-Specific Subnetworks in Feedforward Neural Networks [0.0]
我々は,未使用の重み付きネットワークがその後のタスクを学習するための方法論とネットワーク表現構造を同定する。
提案手法を用いてトレーニングされたネットワークは,タスクのパフォーマンスを犠牲にすることなく,あるいは破滅的な忘れを伴わずに,複数のタスクを学習できることを示す。
論文 参考訳(メタデータ) (2022-07-18T15:07:13Z) - An Empirical Investigation of Representation Learning for Imitation [76.48784376425911]
視覚、強化学習、NLPにおける最近の研究は、補助的な表現学習の目的が、高価なタスク固有の大量のデータの必要性を減らすことを示している。
本稿では,表現学習アルゴリズムを構築するためのモジュラーフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-16T11:23:42Z) - Object-Aware Self-supervised Multi-Label Learning [9.496981642855769]
マルチラベル学習のためのよりきめ細かい表現を得るために,オブジェクト指向自己スーパービジョン(OASS)法を提案する。
提案手法は,提案しない方式でCSI(Class-Specific Instances)を効率的に生成するために利用することができる。
マルチラベル分類のためのVOC2012データセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-05-14T10:14:08Z) - Visuomotor Control in Multi-Object Scenes Using Object-Aware
Representations [25.33452947179541]
ロボット作業におけるオブジェクト指向表現学習の有効性を示す。
本モデルは,サンプル効率のよい制御ポリシーを学習し,最先端のオブジェクト技術より優れている。
論文 参考訳(メタデータ) (2022-05-12T19:48:11Z) - Learning to Represent Action Values as a Hypergraph on the Action
Vertices [17.811355496708728]
行動値推定は強化学習法(RL)の重要な要素である。
多次元のアクション空間の構造を活用することが、アクションの優れた表現を学ぶための鍵となる要素であると推測する。
Atari 2600 ゲームや、離散化物理制御ベンチマークなど、無数の領域に対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2020-10-28T00:19:13Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z) - Semi-supervised Learning with a Teacher-student Network for Generalized
Attribute Prediction [7.462336024223667]
本稿では,視覚特性予測問題を解くための半教師付き学習について述べる。
提案手法は,ファッション属性予測のための様々なベンチマーク上での競合性能を実現する。
論文 参考訳(メタデータ) (2020-07-14T02:06:24Z) - Exploit Clues from Views: Self-Supervised and Regularized Learning for
Multiview Object Recognition [66.87417785210772]
本研究では,マルチビュー自己教師型学習(MV-SSL)の問題点について検討する。
対象不変」表現を追求し,自己指導型学習のための新しい代理課題を提案する。
実験の結果,ビュー不変プロトタイプ埋め込み(VISPE)による認識と検索は,他の自己教師あり学習方法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-28T07:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。