論文の概要: Synthetic-to-Real Domain Generalized Semantic Segmentation for 3D Indoor
Point Clouds
- arxiv url: http://arxiv.org/abs/2212.04668v1
- Date: Fri, 9 Dec 2022 05:07:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 15:13:20.844379
- Title: Synthetic-to-Real Domain Generalized Semantic Segmentation for 3D Indoor
Point Clouds
- Title(参考訳): 3次元屋内点雲のための合成-実領域一般化意味セグメンテーション
- Authors: Yuyang Zhao, Na Zhao, Gim Hee Lee
- Abstract要約: 本稿では,本課題に対して,合成-実領域一般化設定を提案する。
合成と実世界のポイントクラウドデータのドメインギャップは、主に異なるレイアウトとポイントパターンにあります。
CINMixとMulti-prototypeの両方が分配ギャップを狭めることを示した。
- 参考スコア(独自算出の注目度): 69.64240235315864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation in 3D indoor scenes has achieved remarkable performance
under the supervision of large-scale annotated data. However, previous works
rely on the assumption that the training and testing data are of the same
distribution, which may suffer from performance degradation when evaluated on
the out-of-distribution scenes. To alleviate the annotation cost and the
performance degradation, this paper introduces the synthetic-to-real domain
generalization setting to this task. Specifically, the domain gap between
synthetic and real-world point cloud data mainly lies in the different layouts
and point patterns. To address these problems, we first propose a clustering
instance mix (CINMix) augmentation technique to diversify the layouts of the
source data. In addition, we augment the point patterns of the source data and
introduce non-parametric multi-prototypes to ameliorate the intra-class
variance enlarged by the augmented point patterns. The multi-prototypes can
model the intra-class variance and rectify the global classifier in both
training and inference stages. Experiments on the synthetic-to-real benchmark
demonstrate that both CINMix and multi-prototypes can narrow the distribution
gap and thus improve the generalization ability on real-world datasets.
- Abstract(参考訳): 3次元屋内シーンにおけるセマンティックセグメンテーションは,大規模アノテートデータの監督の下で顕著な性能を発揮する。
しかし、以前の研究は、トレーニングデータとテストデータが同じ分布であると仮定しており、分散シーンで評価すると性能が低下する可能性がある。
本稿では,アノテーションのコストと性能劣化を軽減するために,合成から実領域への一般化設定を提案する。
特に、合成と実世界のポイントクラウドデータのドメインギャップは、主に異なるレイアウトとポイントパターンにあります。
これらの問題に対処するため、まず、ソースデータのレイアウトを多様化するクラスタリングインスタンスミックス(cinmix)拡張手法を提案する。
さらに,ソースデータの点パターンを補強し,拡張された点パターンによって拡大されたクラス内分散を改善するために非パラメトリックマルチプロトタイプを導入する。
マルチプロトタイプはクラス内分散をモデル化し、トレーニングと推論の両方の段階でグローバル分類器を修正できる。
CINMixとMulti-prototypeの両方が分散ギャップを狭め、現実世界のデータセットの一般化能力を向上できることを示した。
関連論文リスト
- Deep Domain Isolation and Sample Clustered Federated Learning for Semantic Segmentation [2.515027627030043]
本稿では,2次元セグメンテーションタスクにおける参加者間の共変量変化の影響を初めて検討する。
我々は、モデルの勾配空間内で直接画像領域を分離するディープドメイン分離(DDI)を開発する。
我々は,このクラスタリングアルゴリズムをSCFL(Sample Clustered Federated Learning)フレームワークを通じて活用する。
論文 参考訳(メタデータ) (2024-10-04T12:43:07Z) - First-Order Manifold Data Augmentation for Regression Learning [4.910937238451485]
我々は、新しいデータ駆動型ドメイン非依存データ拡張法であるFOMAを紹介する。
分布内一般化と分布外ベンチマークに基づいてFOMAを評価し,いくつかのニューラルアーキテクチャの一般化を改善することを示す。
論文 参考訳(メタデータ) (2024-06-16T12:35:05Z) - StyDeSty: Min-Max Stylization and Destylization for Single Domain Generalization [85.18995948334592]
単一のドメインの一般化(単一DG)は、単一のトレーニングドメインからのみ見えないドメインに一般化可能な堅牢なモデルを学ぶことを目的としている。
最先端のアプローチは、主に新しいデータを合成するために、敵対的な摂動やスタイルの強化といったデータ拡張に頼っている。
データ拡張の過程で、ソースと擬似ドメインのアライメントを明示的に考慮したemphStyDeStyを提案する。
論文 参考訳(メタデータ) (2024-06-01T02:41:34Z) - Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - Domain-Adaptive Full-Face Gaze Estimation via Novel-View-Synthesis and Feature Disentanglement [12.857137513211866]
本稿では、教師なしドメイン適応のためのトレーニングデータ合成と視線推定モデルからなる効果的なモデルトレーニングパイプラインを提案する。
提案したデータ合成は、単一画像の3D再構成を利用して、3次元の顔形状データセットを必要とせずに、ソース領域から頭部ポーズの範囲を広げる。
本稿では、視線関連特徴を分離し、背景アグリゲーション整合性損失を導入し、合成音源領域の特性を生かしたディエンタングリングオートエンコーダネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-25T15:15:03Z) - SALUDA: Surface-based Automotive Lidar Unsupervised Domain Adaptation [62.889835139583965]
我々は、ソースデータとターゲットデータに基づいて、暗黙の基盤となる表面表現を同時に学習する教師なし補助タスクを導入する。
両方のドメインが同じ遅延表現を共有しているため、モデルは2つのデータソース間の不一致を許容せざるを得ない。
実験の結果,本手法は実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
論文 参考訳(メタデータ) (2023-04-06T17:36:23Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。
本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。
実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文 参考訳(メタデータ) (2021-07-07T11:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。