論文の概要: Learning to Manipulate Individual Objects in an Image
- arxiv url: http://arxiv.org/abs/2004.05495v1
- Date: Sat, 11 Apr 2020 21:50:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 12:48:55.983660
- Title: Learning to Manipulate Individual Objects in an Image
- Title(参考訳): 画像中の個々の物体を操作する学習
- Authors: Yanchao Yang, Yutong Chen and Stefano Soatto
- Abstract要約: 本稿では,独立性および局所性を有する潜在因子を用いた生成モデルを学習する手法について述べる。
これは、潜伏変数の摂動が、オブジェクトに対応する合成画像の局所領域のみに影響を与えることを意味する。
他の教師なし生成モデルとは異なり、オブジェクトレベルのアノテーションを必要とせず、オブジェクト中心の操作を可能にする。
- 参考スコア(独自算出の注目度): 71.55005356240761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We describe a method to train a generative model with latent factors that are
(approximately) independent and localized. This means that perturbing the
latent variables affects only local regions of the synthesized image,
corresponding to objects. Unlike other unsupervised generative models, ours
enables object-centric manipulation, without requiring object-level
annotations, or any form of annotation for that matter. The key to our method
is the combination of spatial disentanglement, enforced by a Contextual
Information Separation loss, and perceptual cycle-consistency, enforced by a
loss that penalizes changes in the image partition in response to perturbations
of the latent factors. We test our method's ability to allow independent
control of spatial and semantic factors of variability on existing datasets and
also introduce two new ones that highlight the limitations of current methods.
- Abstract(参考訳): 本稿では,(ほぼ)独立かつ局所的な潜在因子を用いた生成モデルを訓練する方法について述べる。
これは、潜伏変数の摂動が、オブジェクトに対応する合成画像の局所領域のみに影響を与えることを意味する。
他の教師なし生成モデルとは異なり、オブジェクトレベルのアノテーションやそれに対するいかなるアノテーションも必要とせず、オブジェクト中心の操作を可能にする。
提案手法の鍵となるのは,コンテキスト情報分離損失によって強制される空間的ゆがみと,潜伏因子の摂動に応じて画像分割の変化をペナルティ化する損失によって強制される知覚的周期整合との組み合わせである。
既存のデータセットにおける空間的および意味的因子の独立制御を可能にする手法の能力をテストするとともに,現在の手法の限界を強調する2つの新しい手法を導入する。
関連論文リスト
- Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models [55.99654128127689]
Visual Foundation Models (VFM) は、弱い教師付きピクセル対ポイントのコントラスト蒸留のためのセマンティックラベルを生成するために使用される。
我々は,空間分布とカテゴリー周波数の不均衡に対応するために,点のサンプリング確率を適応させる。
我々の手法は、下流タスクにおける既存の画像からLiDARへのコントラスト蒸留法を一貫して超越している。
論文 参考訳(メタデータ) (2024-05-23T07:48:19Z) - Disentanglement of Latent Representations via Causal Interventions [11.238098505498165]
因果力学に着想を得た新しい解離法を提案する。
我々のモデルは、量子化されたベクトルを因果変数とみなし、因果グラフでそれらをリンクする。
グラフの因果的介入を行い、画像の変動のユニークな要因に影響を与える原子遷移を生成する。
論文 参考訳(メタデータ) (2023-02-02T04:37:29Z) - Self-Supervised Video Object Segmentation via Cutout Prediction and
Tagging [117.73967303377381]
本稿では, 自己教師型ビデオオブジェクト(VOS)アプローチを提案する。
本手法は,対象情報と背景情報の両方を考慮した識別学習損失の定式化に基づく。
提案手法であるCT-VOSは, DAVIS-2017 と Youtube-VOS の2つの挑戦的なベンチマークにおいて,最先端の結果を達成している。
論文 参考訳(メタデータ) (2022-04-22T17:53:27Z) - Learning Conditional Invariance through Cycle Consistency [60.85059977904014]
本稿では,データセットの変動の有意義な要因と独立な要因を識別する新しい手法を提案する。
提案手法は,対象プロパティと残りの入力情報に対する2つの別個の潜在部分空間を含む。
我々は,より意味のある因子を同定し,よりスペーサーや解釈可能なモデルに導く合成および分子データについて実証する。
論文 参考訳(メタデータ) (2021-11-25T17:33:12Z) - Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。
本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。
実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文 参考訳(メタデータ) (2021-07-07T11:43:59Z) - An Image is Worth More Than a Thousand Words: Towards Disentanglement in
the Wild [34.505472771669744]
教師なしの絡み合いは、モデルとデータに誘導的バイアスを伴わずに理論的に不可能であることが示されている。
本稿では,部分的にラベル付けされた要素の集合を分離する手法を提案するとともに,残余因子の相補的集合を分離する手法を提案する。
論文 参考訳(メタデータ) (2021-06-29T17:54:24Z) - Where and What? Examining Interpretable Disentangled Representations [96.32813624341833]
解釈可能なバリエーションの獲得は、長い間、絡み合い学習の目標の1つだった。
独立性の仮定と異なり、解釈性は教師なしの設定での絡み合いを促進するために使われることは滅多にない。
本論文では, 解釈対象と解釈対象の2つの質問について検討し, 離散表現の解釈可能性を検討する。
論文 参考訳(メタデータ) (2021-04-07T11:22:02Z) - NestedVAE: Isolating Common Factors via Weak Supervision [45.366986365879505]
我々は、バイアス低減の課題と、ドメイン間で共通する分離要因の関係を同定する。
共通因子を分離するために、潜伏変数モデルの理論と情報ボトルネック理論を組み合わせる。
共有重みを持つ2つの外部VAEは入力を再構成し、潜伏空間を推論し、一方、ネストされたVAEはペア化された画像の潜伏表現から1つの画像の潜伏表現を再構成しようとする。
論文 参考訳(メタデータ) (2020-02-26T15:49:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。