論文の概要: Domain Disentangled Generative Adversarial Network for Zero-Shot
Sketch-Based 3D Shape Retrieval
- arxiv url: http://arxiv.org/abs/2202.11948v1
- Date: Thu, 24 Feb 2022 08:10:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-25 16:54:57.350723
- Title: Domain Disentangled Generative Adversarial Network for Zero-Shot
Sketch-Based 3D Shape Retrieval
- Title(参考訳): ゼロショットスケッチに基づく3次元形状検索のための領域ディスタングル生成逆数ネットワーク
- Authors: Rui Xu, Zongyan Han, Le Hui, Jianjun Qian, Jin Xie
- Abstract要約: ゼロショットスケッチに基づく3D検索のための新しい領域非絡み合い生成敵ネットワーク(DD-GAN)を提案する。
まず、スケッチと3D形状の学習特徴を分離して、ドメイン不変の特徴とドメイン固有の特徴を生成します。
そこで我々は,各カテゴリのドメイン固有特徴と整列したドメイン不変特徴とを結合した生成的対向ネットワークを開発した。
本研究では、未確認カテゴリの合成サンプルと実例とを組み合わせて、検索のためにネットワークをトレーニングする。
- 参考スコア(独自算出の注目度): 25.023198345521006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sketch-based 3D shape retrieval is a challenging task due to the large domain
discrepancy between sketches and 3D shapes. Since existing methods are trained
and evaluated on the same categories, they cannot effectively recognize the
categories that have not been used during training. In this paper, we propose a
novel domain disentangled generative adversarial network (DD-GAN) for zero-shot
sketch-based 3D retrieval, which can retrieve the unseen categories that are
not accessed during training. Specifically, we first generate domain-invariant
features and domain-specific features by disentangling the learned features of
sketches and 3D shapes, where the domain-invariant features are used to align
with the corresponding word embeddings. Then, we develop a generative
adversarial network that combines the domainspecific features of the seen
categories with the aligned domain-invariant features to synthesize samples,
where the synthesized samples of the unseen categories are generated by using
the corresponding word embeddings. Finally, we use the synthesized samples of
the unseen categories combined with the real samples of the seen categories to
train the network for retrieval, so that the unseen categories can be
recognized. In order to reduce the domain shift between the synthesized domain
and the real domain, we adopt the transductive setting to reduce the gap
between the distributions of the synthesized unseen categories and real unseen
categories. Extensive experiments on the SHREC'13 and SHREC'14 datasets show
that our method significantly improves the retrieval performance of the unseen
categories.
- Abstract(参考訳): スケッチに基づく3次元形状検索は,スケッチと3次元形状の領域差が大きいため,難しい課題である。
既存の手法は同じカテゴリで訓練・評価されているため、トレーニング中に使用されていないカテゴリを効果的に認識することはできない。
本稿では、ゼロショットスケッチに基づく3D検索のための新規なドメイン不整合生成対向ネットワーク(DD-GAN)を提案し、トレーニング中にアクセスできない未知のカテゴリを検索する。
具体的には、まず、スケッチと3次元形状の学習特徴を分離することにより、ドメイン不変の特徴とドメイン固有の特徴を生成し、ドメイン不変の特徴を対応する単語埋め込みと整合させる。
次に,出現するカテゴリのドメイン特有な特徴と整列したドメイン不変特徴を組み合わせた生成的逆ネットワークを開発し,対応する単語埋め込みを用いて未発見のカテゴリの合成サンプルを生成するサンプルを合成する。
最後に,未発見のカテゴリの合成サンプルと,見られたカテゴリの実際のサンプルを組み合わせることで,検索のためのネットワークのトレーニングを行い,未発見のカテゴリを認識できるようにする。
合成された領域と実領域の間の領域シフトを低減するため、合成された未確認カテゴリと実未確認カテゴリの分布間のギャップを低減するために、トランスダクティブ設定を採用する。
SHREC'13とSHREC'14データセットの大規模な実験により,本手法は未確認カテゴリの検索性能を著しく向上することが示された。
関連論文リスト
- CDAD-Net: Bridging Domain Gaps in Generalized Category Discovery [9.505699498746976]
Generalized Category Discovery (GCD)は、既知のクラスと新しいクラスのラベルのないサンプルをクラスタリングするツールである。
本稿では、Across Domain Generalized Category Discovery (AD-GCD)を紹介し、CDAD-NETを治療として提供する。
CDAD-NETは、ラベル付き(ソース)データセットとラベルなし(ターゲット)データセットの両方で、既知の潜在的なクラスサンプルを同期するように設計されている。
実験により、CDAD-NETは既存の文献を8~15%上回り、AD-GCDベンチマークを3つのベンチマークで比較した。
論文 参考訳(メタデータ) (2024-04-08T10:05:24Z) - Neural Vector Fields: Generalizing Distance Vector Fields by Codebooks
and Zero-Curl Regularization [73.3605319281966]
メッシュと暗黙的符号なし距離関数(UDF)を演算する明示的な学習プロセスを採用した新しい3D表現であるNeural Vector Fields (NVF)を提案する。
両NVFを水密化・非水密化・非水密化・非水密化・非水密化・非水密化・非水密化・非水密化・非水密化・クロスドメイン化の4つのシナリオで評価した。
論文 参考訳(メタデータ) (2023-09-04T10:42:56Z) - Neural Vector Fields: Implicit Representation by Explicit Learning [63.337294707047036]
ニューラルベクトル場 (Neural Vector Fields, NVF) という新しい3次元表現法を提案する。
メッシュを直接操作するための明示的な学習プロセスを採用するだけでなく、符号なし距離関数(UDF)の暗黙的な表現も採用している。
提案手法は,まず表面への変位クエリを予測し,テキスト再構成として形状をモデル化する。
論文 参考訳(メタデータ) (2023-03-08T02:36:09Z) - Domain Adaptive Nuclei Instance Segmentation and Classification via
Category-aware Feature Alignment and Pseudo-labelling [65.40672505658213]
本稿では, UDA 核インスタンス分割と分類のための新しいディープニューラルネットワークである Category-Aware 機能アライメントと Pseudo-Labelling Network (CAPL-Net) を提案する。
我々のアプローチは、最先端のUDA手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2022-07-04T07:05:06Z) - Domain Adaptation with Category Attention Network for Deep Sentiment
Analysis [23.526388120436437]
クロスドメインの感情分類タスクは、ソースドメイン内の既存のラベル付きデータと、ターゲットドメイン内のラベルなしまたは少ないラベル付きデータを利用して、データ分散間のシフトを減らし、ターゲットドメイン内のパフォーマンスを改善することを目的としている。
既存のドメイン横断感情分類手法は、優れた適応性能を得るために、ピボット、すなわちドメイン共有感情語と非ピボット、すなわちドメイン固有感情語を区別する必要がある。
本稿では、まずカテゴリー注意ネットワーク(CAN)を設計し、次にCANと畳み込みニューラルネットワークを統合するCAN-CNNというモデルを提案する。
論文 参考訳(メタデータ) (2021-12-31T04:03:48Z) - Segmenting 3D Hybrid Scenes via Zero-Shot Learning [13.161136148641813]
この研究は、ゼロショット学習の枠組みの下で、3Dハイブリッドシーンのポイントクラウドセマンティックセマンティックセマンティクスの問題に取り組むことを目的としている。
本稿では、PFNetと呼ばれる、オブジェクトの様々なクラスに対するポイント特徴を、見えていないクラスと見えないクラスの両方のセマンティック特徴を利用して合成するネットワークを提案する。
提案したPFNet は点特徴を合成するために GAN アーキテクチャを用いており、新しい意味正規化器を適用することにより、目に見えるクラスと目に見えないクラスの特徴のセマンティックな関係が統合される。
本研究では,S3DISデータセットとScanNetデータセットを6つの異なるデータ分割で再編成し,アルゴリズム評価のための2つのベンチマークを提案する。
論文 参考訳(メタデータ) (2021-07-01T13:21:49Z) - Towards Novel Target Discovery Through Open-Set Domain Adaptation [73.81537683043206]
オープンソースドメイン適応(OSDA)は、ターゲットドメインが外部のソースドメインでは観察できない新しいカテゴリのサンプルを含むと考えている。
対象領域に見られるカテゴリを正確に識別し,未知のカテゴリのセマンティクス特性を効果的に回復するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-06T04:22:29Z) - I^3Net: Implicit Instance-Invariant Network for Adapting One-Stage
Object Detectors [64.93963042395976]
暗黙のInstance-Invariant Network(I3Net)は、ワンステージ検出器の適応に適しています。
i3netは、異なる層における深い特徴の自然な特徴を利用してインスタンス不変な特徴を暗黙的に学習する。
実験によると、I3Netはベンチマークデータセットの最先端のパフォーマンスを上回っている。
論文 参考訳(メタデータ) (2021-03-25T11:14:36Z) - Robust Domain-Free Domain Generalization with Class-aware Alignment [4.442096198968069]
ドメインフリードメイン一般化(DFDG)は、目に見えないテストドメインでより良い一般化性能を実現するモデル非依存の方法である。
DFDGは新しい戦略を用いてドメイン不変なクラス差別的特徴を学習する。
時系列センサと画像分類公開データセットの両方で競合性能を得る。
論文 参考訳(メタデータ) (2021-02-17T17:46:06Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。