論文の概要: Point-MoE: Towards Cross-Domain Generalization in 3D Semantic Segmentation via Mixture-of-Experts
- arxiv url: http://arxiv.org/abs/2505.23926v1
- Date: Thu, 29 May 2025 18:21:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.619579
- Title: Point-MoE: Towards Cross-Domain Generalization in 3D Semantic Segmentation via Mixture-of-Experts
- Title(参考訳): Point-MoE:Mixture-of-Expertsによる3次元セマンティックセマンティックセグメンテーションにおけるクロスドメイン一般化に向けて
- Authors: Xuweiyi Chen, Wentao Zhou, Aruni RoyChowdhury, Zezhou Cheng,
- Abstract要約: 我々は,3次元知覚におけるクロスドメインの一般化を実現するために,Mixture-of-ExpertsアーキテクチャであるPoint-MoEを提案する。
標準的なポイントクラウドバックボーンは、混合ドメインデータでトレーニングされた場合、パフォーマンスが大幅に低下する。
シンプルなトップkルーティング戦略のPoint-MoEは、ドメインラベルにアクセスしなくても、専門家を自動的に専門化することができる。
- 参考スコア(独自算出の注目度): 7.787211625411271
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While scaling laws have transformed natural language processing and computer vision, 3D point cloud understanding has yet to reach that stage. This can be attributed to both the comparatively smaller scale of 3D datasets, as well as the disparate sources of the data itself. Point clouds are captured by diverse sensors (e.g., depth cameras, LiDAR) across varied domains (e.g., indoor, outdoor), each introducing unique scanning patterns, sampling densities, and semantic biases. Such domain heterogeneity poses a major barrier towards training unified models at scale, especially under the realistic constraint that domain labels are typically inaccessible at inference time. In this work, we propose Point-MoE, a Mixture-of-Experts architecture designed to enable large-scale, cross-domain generalization in 3D perception. We show that standard point cloud backbones degrade significantly in performance when trained on mixed-domain data, whereas Point-MoE with a simple top-k routing strategy can automatically specialize experts, even without access to domain labels. Our experiments demonstrate that Point-MoE not only outperforms strong multi-domain baselines but also generalizes better to unseen domains. This work highlights a scalable path forward for 3D understanding: letting the model discover structure in diverse 3D data, rather than imposing it via manual curation or domain supervision.
- Abstract(参考訳): スケーリング法則は自然言語処理とコンピュータビジョンに変化をもたらしたが、3Dポイントのクラウド理解はまだその段階には達していない。
これは、比較的小さな3Dデータセットのスケールと、データ自体の異なるソースの両方に起因する。
ポイントクラウドは、さまざまなドメイン(例えば、屋内、屋外)にわたる多様なセンサー(例えば、深度カメラ、LiDAR)によってキャプチャされ、それぞれ独自のスキャンパターン、密度のサンプリング、セマンティックバイアスが導入される。
このようなドメインの不均一性は、特にドメインラベルが推論時に通常アクセスできないという現実的な制約の下で、大規模に統一モデルを訓練する上で大きな障壁となる。
本研究では,3次元知覚において,大規模でクロスドメインな一般化を実現するために設計されたMixture-of-ExpertsアーキテクチャであるPoint-MoEを提案する。
一方、単純なトップkルーティング戦略を持つPoint-MoEでは、ドメインラベルにアクセスしなくても、専門家を自動で専門化することが可能である。
我々の実験は、Point-MoEが強いマルチドメインベースラインを上回るだけでなく、目に見えないドメインに最適化できることを示した。
この作業では,手作業によるキュレーションやドメインの監視ではなく,さまざまな3Dデータの構造をモデルに発見する,という3D理解のためのスケーラブルなパスが強調されている。
関連論文リスト
- DG-MVP: 3D Domain Generalization via Multiple Views of Point Clouds for Classification [10.744510913722817]
ディープニューラルネットワークは3Dポイントクラウド分類において大きな成功を収めている。
本稿では,3次元クラウド領域の一般化問題に焦点をあてる。
本稿では,3次元点雲領域の一般化手法を提案する。
論文 参考訳(メタデータ) (2025-04-16T19:43:32Z) - One for All: Multi-Domain Joint Training for Point Cloud Based 3D Object Detection [71.78795573911512]
textbfOneDet3Dは、異なるドメイン間での3D検出に対処する汎用的なワン・ツー・オール・モデルである。
本稿では、データ干渉問題に対処するため、ルーティング機構によって誘導される散乱とコンテキストにおけるドメイン認識を提案する。
完全なスパース構造とアンカーフリーヘッドは、さらに大きなスケールの差のある点雲を収容する。
論文 参考訳(メタデータ) (2024-11-03T14:21:56Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - View-Consistent Hierarchical 3D Segmentation Using Ultrametric Feature Fields [52.08335264414515]
我々は3次元シーンを表すニューラル・レージアンス・フィールド(NeRF)内の新しい特徴場を学習する。
本手法は、ビュー一貫性の多粒性2Dセグメンテーションを入力とし、3D一貫性のセグメンテーションの階層構造を出力として生成する。
提案手法と,多視点画像と多粒性セグメンテーションを用いた合成データセットのベースラインの評価を行い,精度と視点整合性を向上したことを示す。
論文 参考訳(メタデータ) (2024-05-30T04:14:58Z) - SSDA3D: Semi-supervised Domain Adaptation for 3D Object Detection from
Point Cloud [125.9472454212909]
本稿では,3次元物体検出(SSDA3D)のための半改良型領域適応法を提案する。
SSDA3Dはドメイン間適応ステージとドメイン内一般化ステージを含む。
実験の結果,10%のラベル付きターゲットデータしか持たないSSDA3Dは,100%のターゲットラベルを持つ完全教師付きオラクルモデルを上回ることができることがわかった。
論文 参考訳(メタデータ) (2022-12-06T09:32:44Z) - MetaSets: Meta-Learning on Point Sets for Generalizable Representations [100.5981809166658]
本稿では,3次元領域一般化(DDG)の新たな課題について検討し,学習過程においてそれらにアクセスすることなく,他の目に見えない点雲の領域にモデルを一般化することを目的とする。
本稿ではメタセットを用いてこの問題に対処することを提案する。メタ学習は、慎重に設計された変換された点集合上の分類タスク群からポイントクラウド表現を抽出する。
実験結果から,MetaSetsは既存の3次元深層学習手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-04-15T03:24:39Z) - Domain Adaptation for Real-World Single View 3D Reconstruction [1.611271868398988]
教師なしのドメイン適応は、ラベル付き合成ソースドメインからラベルなしの実際のターゲットドメインに知識を転送するために使用することができる。
本稿では,3次元モデルでは対象のドメインデータが教師されないが,クラスラベルでは教師されないという事実を生かして,新しいアーキテクチャを提案する。
その結果はShapeNetをソースドメインとして、Object Domain Suite(ODDS)データセット内のドメインをターゲットとして実行されます。
論文 参考訳(メタデータ) (2021-08-24T22:02:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。