論文の概要: OPAL-Net: A Generative Model for Part-based Object Layout Generation
- arxiv url: http://arxiv.org/abs/2006.00190v1
- Date: Sat, 30 May 2020 06:25:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 18:17:15.391406
- Title: OPAL-Net: A Generative Model for Part-based Object Layout Generation
- Title(参考訳): OPAL-Net:部分ベースオブジェクトレイアウト生成モデル
- Authors: Rishabh Baghel, Ravi Kiran Sarvadevabhatla
- Abstract要約: OPAL-Netは,複数カテゴリのオブジェクトの部分的レイアウト生成のための新しい階層型アーキテクチャである。
我々は,境界ボックスレイアウトのセマンティック条件付き自己回帰生成と,オブジェクトのピクセルレベルの部分レイアウトを含む粗大な戦略を採用する。
- 参考スコア(独自算出の注目度): 10.340665633567081
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose OPAL-Net, a novel hierarchical architecture for part-based layout
generation of objects from multiple categories using a single unified model. We
adopt a coarse-to-fine strategy involving semantically conditioned
autoregressive generation of bounding box layouts and pixel-level part layouts
for objects. We use Graph Convolutional Networks, Deep Recurrent Networks along
with custom-designed Conditional Variational Autoencoders to enable flexible,
diverse and category-aware generation of object layouts. We train OPAL-Net on
PASCAL-Parts dataset. The generated samples and corresponding evaluation scores
demonstrate the versatility of OPAL-Net compared to ablative variants and
baselines.
- Abstract(参考訳): 単一統一モデルを用いて複数のカテゴリからオブジェクトを部品ベースで生成する新しい階層型アーキテクチャであるopal-netを提案する。
我々は,境界ボックスレイアウトのセマンティック条件付き自己回帰生成と,オブジェクトのピクセルレベルの部分レイアウトを含む粗大な戦略を採用する。
私たちは、グラフ畳み込みネットワーク、ディープリカレントネットワーク、およびカスタム設計の条件付き変分オートエンコーダを使用して、柔軟で多様でカテゴリ対応なオブジェクトレイアウト生成を可能にします。
PASCAL-Partsデータセット上でOPAL-Netをトレーニングする。
生成されたサンプルとそれに対応する評価スコアは,ablative variantsとbaselinesと比較してOPAL-Netの汎用性を示した。
関連論文リスト
- DStruct2Design: Data and Benchmarks for Data Structure Driven Generative Floor Plan Design [5.567585193148804]
フロアプラン生成のデータ構造定式化のための新しいデータセットを構築した。
部分的あるいは完全な制約が与えられたフロアプラン生成の課題について検討する。
数値制約を考慮したフロアプラン生成問題に対するフロアプランデータ構造LLMの適用可能性を示す。
論文 参考訳(メタデータ) (2024-07-22T15:27:55Z) - Transformer Architecture for NetsDB [0.0]
我々はNetsDBで機能するディープラーニングモデルのためのトランスフォーマーのエンドツーエンド実装を作成します。
分散処理、デプロイメント、効率的な推論のために、当社のモデルから重みをロードします。
論文 参考訳(メタデータ) (2024-05-08T04:38:36Z) - MeronymNet: A Hierarchical Approach for Unified and Controllable
Multi-Category Object Generation [7.577219401804674]
複数カテゴリオブジェクトの制御可能な部分ベース生成のための新しい階層的アプローチであるMeonymNetを紹介する。
我々は,境界ボックスレイアウトのセマンティックな条件付き生成,ピクセルレベルの部分レイアウト,そして最終的にはオブジェクト自体の描写を含む,粗大な戦略を導出する。
論文 参考訳(メタデータ) (2021-10-17T13:20:35Z) - Collaging Class-specific GANs for Semantic Image Synthesis [68.87294033259417]
本稿では,高分解能なセマンティック画像合成のための新しい手法を提案する。
1つのベースイメージジェネレータと複数のクラス固有のジェネレータで構成される。
実験により,本手法は高解像度で高品質な画像を生成することができることが示された。
論文 参考訳(メタデータ) (2021-10-08T17:46:56Z) - Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。
私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文 参考訳(メタデータ) (2021-07-28T03:46:57Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z) - SetVAE: Learning Hierarchical Composition for Generative Modeling of
Set-Structured Data [27.274328701618]
集合の階層的変分オートエンコーダであるSetVAEを提案する。
セットエンコーディングの最近の進歩に動機づけられて、我々は最初にセットを分割し、元のカーディナリティにパーティションを投影する注意深いモジュールの上にSetVAEを構築します。
我々は,本モデルが集合のサイズを示さずに一般化し,監督なしに興味深い部分集合関係を学習できることを実証する。
論文 参考訳(メタデータ) (2021-03-29T14:01:18Z) - LPMNet: Latent Part Modification and Generation for 3D Point Clouds [3.04585143845864]
本稿では,意味的部分と大域的形状の両方の生成と修正を処理できる単一エンドツーエンドオートエンコーダモデルを提案する。
提案手法は,3次元点雲モデル間の部分交換と異なる部分による合成をサポートし,遅延表現を直接編集して新しいモデルを生成する。
論文 参考訳(メタデータ) (2020-08-08T17:24:37Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z) - GFPNet: A Deep Network for Learning Shape Completion in Generic Fitted
Primitives [68.8204255655161]
本稿では,GP(Generic Primitives)と呼ばれるオブジェクト再構成装置を提案する。
GFPNet は ModelNet および KITTI ベンチマークデータセットの性能評価結果を提供することで, 形状完成手法の状況と競合することを示す。
論文 参考訳(メタデータ) (2020-06-03T08:29:27Z) - Object-Centric Image Generation from Layouts [93.10217725729468]
複数のオブジェクトを持つ複雑なシーンを生成するレイアウト・ツー・イメージ生成法を開発した。
本手法は,シーン内のオブジェクト間の空間的関係の表現を学習し,レイアウトの忠実度の向上につながる。
本稿では,Fr'echet Inception Distanceのオブジェクト中心適応であるSceneFIDを紹介する。
論文 参考訳(メタデータ) (2020-03-16T21:40:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。