論文の概要: Critic Guided Segmentation of Rewarding Objects in First-Person Views
- arxiv url: http://arxiv.org/abs/2107.09540v1
- Date: Tue, 20 Jul 2021 14:54:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-21 18:32:00.536895
- Title: Critic Guided Segmentation of Rewarding Objects in First-Person Views
- Title(参考訳): 初対人視点におけるリワード対象の批判的指導的セグメンテーション
- Authors: Andrew Melnik, Augustin Harter, Christian Limberg, Krishan Rana, Niko
Suenderhauf, Helge Ritter
- Abstract要約: 批判モデルからのフィードバックのみを用いて、Hourglassネットワークをトレーニングする。
ネットワークは、ハイスコア画像の批評家のスコアを減少させ、低スコア画像の批評家のスコアを増大させるマスクを作成することを学習する。
我々は、NeurIPS 2020 MineRL Competition Trackから模擬学習データセットでモデルをトレーニングした。
- 参考スコア(独自算出の注目度): 0.8808021343665321
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work discusses a learning approach to mask rewarding objects in images
using sparse reward signals from an imitation learning dataset. For that, we
train an Hourglass network using only feedback from a critic model. The
Hourglass network learns to produce a mask to decrease the critic's score of a
high score image and increase the critic's score of a low score image by
swapping the masked areas between these two images. We trained the model on an
imitation learning dataset from the NeurIPS 2020 MineRL Competition Track,
where our model learned to mask rewarding objects in a complex interactive 3D
environment with a sparse reward signal. This approach was part of the 1st
place winning solution in this competition. Video demonstration and code:
https://rebrand.ly/critic-guided-segmentation
- Abstract(参考訳): 本研究は、模倣学習データセットからのスパース報奨信号を用いて画像中のオブジェクトをマスキングする学習手法について述べる。
そのため、批判モデルからのフィードバックのみを用いて、Hourglassネットワークをトレーニングする。
砂時計ネットワークは、この2つの画像間のマスク領域を交換することにより、高得点画像の批評家のスコアを下げ、低スコア画像の批評家のスコアを増加させるマスクの作成を学習する。
我々は、このモデルをNeurIPS 2020 MineRL Competition Trackから模擬学習データセットでトレーニングした。
このアプローチは、この競争で1位を獲得したソリューションのひとつでした。
ビデオデモとコード: https://rebrand.ly/critic-guided-segmentation
関連論文リスト
- Supervised Deep Learning for Content-Aware Image Retargeting with
Fourier Convolutions [11.031841470875571]
画像は、コンテンツに注意して画像のサイズを変更することを目的としている。
ラベル付きデータセットは、イメージタスクでディープラーニングモデルのトレーニングには使用できない。
通常の畳み込みニューラルネットワークは、推論時間で異なるサイズの画像を生成することができない。
論文 参考訳(メタデータ) (2023-06-12T19:17:44Z) - Learning 3D Photography Videos via Self-supervised Diffusion on Single
Images [105.81348348510551]
3D写真は、静止画を3D視覚効果のあるビデオにレンダリングする。
既存のアプローチは通常、まず単眼深度推定を行い、次に様々な視点で入力フレームを後続のフレームに描画する。
我々は、入力オブジェクトの空間と時間を拡張する、新しいタスク、out-animationを提案する。
論文 参考訳(メタデータ) (2023-02-21T16:18:40Z) - Learning to Detect Every Thing in an Open World [139.78830329914135]
我々は、Learning to Detect Every Thing (LDET)と呼ぶ、シンプルながら驚くほど強力なデータ拡張とトレーニングスキームを提案する。
可視だがラベル付けされていない背景オブジェクトの隠蔽を避けるため、元の画像の小さな領域から採取した背景画像上に注釈付きオブジェクトを貼り付ける。
LDETは、オープンワールドのインスタンスセグメンテーションタスクにおいて、多くのデータセットに大きな改善をもたらす。
論文 参考訳(メタデータ) (2021-12-03T03:56:06Z) - Learning To Segment Dominant Object Motion From Watching Videos [72.57852930273256]
我々は,有意な移動物体セグメンテーションのための単純なフレームワークを構想する。このフレームワークは,有意なデータを必要としないし,有意な前処理や事前学習された光フローマップに依存しない。
層状画像表現に着想を得て,アフィンパラメトリックの動きに応じて画素領域をグループ化する手法を提案する。
これにより、トレーニングと推論の両方の入力として、RGBイメージペアのみを使用して、支配的なフォアグラウンドオブジェクトのセグメンテーションを学習することができる。
論文 参考訳(メタデータ) (2021-11-28T14:51:00Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - SSR: Semi-supervised Soft Rasterizer for single-view 2D to 3D
Reconstruction [14.89252161483621]
ソフトアスタライズ法は2次元画像からの正確な3次元再構成を実現した。
このような3次元再構成手法でラベルなし画像を活用することにより、ラベル付けの労力をさらに削減する。
実験の結果,2つのオブジェクトのみをラベル付けしても,ラベル付けされていない例を利用する場合,ShapeNetは大幅に改善されることがわかった。
論文 参考訳(メタデータ) (2021-08-21T23:14:38Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - Self-Supervised Viewpoint Learning From Image Collections [116.56304441362994]
本稿では,解析・合成パラダイムを取り入れた新たな学習フレームワークを提案する。
提案手法は,人間の顔,車,バス,電車など,複数の対象カテゴリに対して,完全に教師されたアプローチに対して競争力を発揮することを示す。
論文 参考訳(メタデータ) (2020-04-03T22:01:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。