論文の概要: MeronymNet: A Hierarchical Approach for Unified and Controllable
Multi-Category Object Generation
- arxiv url: http://arxiv.org/abs/2110.08818v1
- Date: Sun, 17 Oct 2021 13:20:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 20:54:19.895295
- Title: MeronymNet: A Hierarchical Approach for Unified and Controllable
Multi-Category Object Generation
- Title(参考訳): MeronymNet: 統一および制御可能なマルチカテゴリオブジェクト生成のための階層的アプローチ
- Authors: Rishabh Baghel, Abhishek Trivedi, Tejas Ravichandran, Ravi Kiran
Sarvadevabhatla
- Abstract要約: 複数カテゴリオブジェクトの制御可能な部分ベース生成のための新しい階層的アプローチであるMeonymNetを紹介する。
我々は,境界ボックスレイアウトのセマンティックな条件付き生成,ピクセルレベルの部分レイアウト,そして最終的にはオブジェクト自体の描写を含む,粗大な戦略を導出する。
- 参考スコア(独自算出の注目度): 7.577219401804674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce MeronymNet, a novel hierarchical approach for controllable,
part-based generation of multi-category objects using a single unified model.
We adopt a guided coarse-to-fine strategy involving semantically conditioned
generation of bounding box layouts, pixel-level part layouts and ultimately,
the object depictions themselves. We use Graph Convolutional Networks, Deep
Recurrent Networks along with custom-designed Conditional Variational
Autoencoders to enable flexible, diverse and category-aware generation of 2-D
objects in a controlled manner. The performance scores for generated objects
reflect MeronymNet's superior performance compared to multiple strong baselines
and ablative variants. We also showcase MeronymNet's suitability for
controllable object generation and interactive object editing at various levels
of structural and semantic granularity.
- Abstract(参考訳): 単一統一モデルを用いて、制御可能な部分ベースの複数カテゴリオブジェクト生成のための新しい階層的アプローチであるMeonymNetを紹介する。
我々は,境界ボックスレイアウトのセマンティックな条件付き生成,ピクセルレベルの部分レイアウト,そして最終的にはオブジェクト自体の描写を含む粗大な戦略を採用した。
グラフ畳み込みネットワーク,ディープリカレントネットワーク,およびカスタム設計の条件付き変分自動エンコーダを用いて,柔軟で多種多様な2次元オブジェクトを制御方法で生成する。
生成されたオブジェクトのパフォーマンススコアは、複数の強力なベースラインとアブレイティブ変種と比較してmeronymnetの優れたパフォーマンスを反映している。
また,MeronymNetの制御可能なオブジェクト生成や対話型オブジェクト編集に,さまざまな構造的およびセマンティックな粒度で適していることを示す。
関連論文リスト
- Occlusion-Aware Instance Segmentation via BiLayer Network Architectures [73.45922226843435]
本稿では,2層畳み込みネットワーク(BCNet)を提案する。このネットワークでは,トップ層がオブジェクト(オブオーバ)を検出し,ボトム層が部分的にオブオーバドされたインスタンス(オブオーバド)を推測する。
一般的な畳み込みネットワーク設計,すなわちFCN(Fully Convolutional Network)とGCN(Graph Convolutional Network)を用いた2層構造の有効性について検討する。
論文 参考訳(メタデータ) (2022-08-08T21:39:26Z) - Segmenting Moving Objects via an Object-Centric Layered Representation [100.26138772664811]
深層表現を用いたオブジェクト中心セグメンテーションモデルを提案する。
複数のオブジェクトで合成トレーニングデータを生成するスケーラブルなパイプラインを導入する。
標準的なビデオセグメンテーションベンチマークでモデルを評価する。
論文 参考訳(メタデータ) (2022-07-05T17:59:43Z) - A Unified Architecture of Semantic Segmentation and Hierarchical
Generative Adversarial Networks for Expression Manipulation [52.911307452212256]
セマンティックセグメンテーションと階層的GANの統一アーキテクチャを開発する。
我々のフレームワークのユニークな利点は、将来的なセマンティックセグメンテーションネットワーク条件を生成モデルに渡すことである。
我々は,AffectNetとRaFDの2つの難解な表情翻訳ベンチマークとセマンティックセグメンテーションベンチマークであるCelebAMask-HQについて評価を行った。
論文 参考訳(メタデータ) (2021-12-08T22:06:31Z) - Labels4Free: Unsupervised Segmentation using StyleGAN [40.39780497423365]
本稿では,StyleGAN生成オブジェクトに対する教師なしセグメンテーションフレームワークを提案する。
最先端の教師付きセグメンテーションネットワークに対する比較結果について報告する。
論文 参考訳(メタデータ) (2021-03-27T18:59:22Z) - Visual Concept Reasoning Networks [93.99840807973546]
分割変換マージ戦略は、視覚認識タスクのための畳み込みニューラルネットワークのアーキテクチャ制約として広く使用されている。
我々は、この戦略を利用して、高レベルの視覚概念間の推論を可能にするために、Visual Concept Reasoning Networks (VCRNet) と組み合わせることを提案する。
提案するモデルであるVCRNetは、パラメータ数を1%以下にすることで、一貫して性能を向上する。
論文 参考訳(メタデータ) (2020-08-26T20:02:40Z) - Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:11:22Z) - OPAL-Net: A Generative Model for Part-based Object Layout Generation [10.340665633567081]
OPAL-Netは,複数カテゴリのオブジェクトの部分的レイアウト生成のための新しい階層型アーキテクチャである。
我々は,境界ボックスレイアウトのセマンティック条件付き自己回帰生成と,オブジェクトのピクセルレベルの部分レイアウトを含む粗大な戦略を採用する。
論文 参考訳(メタデータ) (2020-05-30T06:25:19Z) - Object-Centric Image Generation from Layouts [93.10217725729468]
複数のオブジェクトを持つ複雑なシーンを生成するレイアウト・ツー・イメージ生成法を開発した。
本手法は,シーン内のオブジェクト間の空間的関係の表現を学習し,レイアウトの忠実度の向上につながる。
本稿では,Fr'echet Inception Distanceのオブジェクト中心適応であるSceneFIDを紹介する。
論文 参考訳(メタデータ) (2020-03-16T21:40:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。