論文の概要: Shape Distribution Matters: Shape-specific Mixture-of-Experts for Amodal Segmentation under Diverse Occlusions
- arxiv url: http://arxiv.org/abs/2508.01664v1
- Date: Sun, 03 Aug 2025 08:47:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.995783
- Title: Shape Distribution Matters: Shape-specific Mixture-of-Experts for Amodal Segmentation under Diverse Occlusions
- Title(参考訳): 形状分布の諸問題: 異種介在物によるアモーダルセグメンテーションのための形状比混合
- Authors: Zhixuan Li, Yujia Liu, Chen Hui, Jeonghaeng Lee, Sanghoon Lee, Weisi Lin,
- Abstract要約: 本稿では,アモーダルセグメンテーションのためのShapeMoEを提案する。
ShapeMoEは、各オブジェクトをキー形状特性をキャプチャするコンパクトなガウス埋め込みにエンコードする。
次にShape-Aware Sparse Routerがオブジェクトを最も適したエキスパートにマッピングし、正確かつ効率的なShape-Awareのエキスパートルーティングを可能にする。
- 参考スコア(独自算出の注目度): 44.90637932759307
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Amodal segmentation targets to predict complete object masks, covering both visible and occluded regions. This task poses significant challenges due to complex occlusions and extreme shape variation, from rigid furniture to highly deformable clothing. Existing one-size-fits-all approaches rely on a single model to handle all shape types, struggling to capture and reason about diverse amodal shapes due to limited representation capacity. A natural solution is to adopt a Mixture-of-Experts (MoE) framework, assigning experts to different shape patterns. However, naively applying MoE without considering the object's underlying shape distribution can lead to mismatched expert routing and insufficient expert specialization, resulting in redundant or underutilized experts. To deal with these issues, we introduce ShapeMoE, a shape-specific sparse Mixture-of-Experts framework for amodal segmentation. The key idea is to learn a latent shape distribution space and dynamically route each object to a lightweight expert tailored to its shape characteristics. Specifically, ShapeMoE encodes each object into a compact Gaussian embedding that captures key shape characteristics. A Shape-Aware Sparse Router then maps the object to the most suitable expert, enabling precise and efficient shape-aware expert routing. Each expert is designed as lightweight and specialized in predicting occluded regions for specific shape patterns. ShapeMoE offers well interpretability via clear shape-to-expert correspondence, while maintaining high capacity and efficiency. Experiments on COCOA-cls, KINS, and D2SA show that ShapeMoE consistently outperforms state-of-the-art methods, especially in occluded region segmentation. The code will be released.
- Abstract(参考訳): アモーダルセグメンテーションは、完全なオブジェクトマスクを予測し、可視領域と隠蔽領域の両方をカバーする。
この作業は、硬い家具から高度に変形可能な衣服に至るまで、複雑な閉塞と極端な形状の変化のために重大な課題を生んでいる。
既存のワンサイズアプローチは、すべての形状のタイプを扱うために単一のモデルに依存しており、表現能力に制限があるため、様々なアモーダル形状を捉えるのに苦労している。
自然な解決策は、Mixture-of-Experts(MoE)フレームワークを採用して、専門家に異なる形状パターンを割り当てることである。
しかし、オブジェクトの基盤となる形状の分布を考慮せずに間接的にMoEを適用すると、ミスマッチした専門家のルーティングや専門家の専門化が不十分になり、結果として冗長あるいは未使用のエキスパートが生まれる。
これらの問題に対処するために、アモーダルセグメンテーションのための形状特異的なスパース・ミクチャー・オブ・エクストラルツ・フレームワークであるShapeMoEを紹介する。
鍵となるアイデアは、潜在形状分布空間を学習し、その形状特性に合わせて各オブジェクトを軽量な専門家に動的にルーティングすることである。
具体的には、ShapeMoEは各オブジェクトをキー形状の特徴をキャプチャするコンパクトなガウス埋め込みにエンコードする。
次にShape-Aware Sparse Routerがオブジェクトを最も適したエキスパートにマッピングし、正確かつ効率的なShape-Awareのエキスパートルーティングを可能にする。
各専門家は、特定の形状パターンの隠蔽領域を予測するために、軽量で専門的に設計されている。
ShapeMoEは、高いキャパシティと効率を保ちながら、明確な形状と熟練の対応を通して、よく解釈できる。
COCOA-cls、KINS、D2SAの実験により、ShapeMoEは、特に閉塞領域のセグメンテーションにおいて、常に最先端の手法より優れていることが示された。
コードはリリースされます。
関連論文リスト
- Single Point, Full Mask: Velocity-Guided Level Set Evolution for End-to-End Amodal Segmentation [41.188891367216804]
アモーダルセグメンテーションは、視覚的な外観を持たない隠蔽領域を含む完全な物体の形状を復元することを目的としている。
既存の方法は、目に見えるマスクやバウンディングボックスのような強力なプロンプトに頼っている。
本稿では,点ベースのプロンプトから明示的な進化を行うVELAを提案する。
論文 参考訳(メタデータ) (2025-08-03T08:36:13Z) - QuadricFormer: Scene as Superquadrics for 3D Semantic Occupancy Prediction [49.75084732129701]
3D占有予測は、堅牢な自動運転システムにとって不可欠である。
既存の手法のほとんどは、密度の高いボクセルベースのシーン表現を使用している。
効率的な3次元占有予測のためのスーパークワッドリックモデルであるQuadricFormerを提案する。
論文 参考訳(メタデータ) (2025-06-12T17:59:45Z) - Mixture-of-Shape-Experts (MoSE): End-to-End Shape Dictionary Framework to Prompt SAM for Generalizable Medical Segmentation [18.269371724383067]
そこで我々は,Mixture-of-Shape-Experts (MoSE) フレームワークを提案し,Mixture-of-Experts (MoE) トレーニングの考え方を辞書学習にシームレスに統合する。
本手法は,各辞書の原子を形状専門家として概念化し,個々の意味的形状情報を符号化する。
ゲーティングネットワークは、これらの形状の専門家を動的に融合して頑丈な形状マップを作り、SAMエンコーディングによってスパースアクティベーションを誘導して過度な適合を防ぐ。
論文 参考訳(メタデータ) (2025-04-13T14:34:52Z) - Mixture of Group Experts for Learning Invariant Representations [25.935653652324532]
わずかに活性化されたMixture-of-Experts (MoE)モデルはトークン当たりの一貫した計算コストを維持しながらパラメータ数を効果的に増加させる。
スパース表現にインスパイアされた上位$kのルーティングによるバニラMOEの新しい視点を示す。
グループエキスパートの混合(Mixture of Group Experts, MOGE)と呼ばれるトップ$kのルーティング入力に対するグループスパース正規化手法を提案する。
論文 参考訳(メタデータ) (2025-04-12T15:58:02Z) - Unveiling the Invisible: Reasoning Complex Occlusions Amodally with AURA [49.10341970643037]
アモーダルセグメンテーションは、隠蔽された領域の外観が利用できない場合でも、隠蔽された物体の完全な形状を推測することを目的としている。
現在のアモーダルセグメンテーション手法では、テキスト入力によってユーザと対話する能力が欠如している。
本稿では,隠蔽対象物の完全な非モーダル形状を予測することを目的とした,非モーダル推論セグメンテーション(amodal reasoning segmentation)という新しいタスクを提案する。
論文 参考訳(メタデータ) (2025-03-13T10:08:18Z) - Multilinear Mixture of Experts: Scalable Expert Specialization through Factorization [51.98792406392873]
Mixture of Experts (MoE)は、高密度層をより小さくモジュール化された計算に分解する強力な方法を提供する。
大きな課題は、きめ細かい特殊化を達成するのに十分高い専門家の数をスケーリングする計算コストである。
視覚モデルに焦点をあて、この問題に対処するため、Multilinear Mixture of Experts(mu$MoE)層を提案する。
論文 参考訳(メタデータ) (2024-02-19T21:20:22Z) - Skeleton-Guided Instance Separation for Fine-Grained Segmentation in
Microscopy [23.848474219551818]
顕微鏡(MS)画像解析における基本的な課題の1つは、インスタンスセグメンテーション(IS)である。
我々は,この課題に対処し,MS画像におけるISの精度を高めるために,A2B-ISという新しいワンステージフレームワークを提案する。
提案手法は2つの大規模MSデータセットに対して徹底的に検証されている。
論文 参考訳(メタデータ) (2024-01-18T11:14:32Z) - DiffComplete: Diffusion-based Generative 3D Shape Completion [114.43353365917015]
3次元レンジスキャンにおける形状完成のための拡散に基づく新しいアプローチを提案する。
私たちはリアリズム、マルチモダリティ、高忠実さのバランスを取ります。
DiffCompleteは2つの大規模3次元形状補完ベンチマークに新しいSOTA性能を設定する。
論文 参考訳(メタデータ) (2023-06-28T16:07:36Z) - NeuroMorph: Unsupervised Shape Interpolation and Correspondence in One
Go [109.88509362837475]
入力2つの3次元形状を考慮したニューラルネットワークアーキテクチャであるNeuroMorphを提案する。
NeuroMorphはそれらの間のスムーズかつポイントツーポイント対応を生成する。
異なる対象カテゴリの非等尺性ペアを含む、さまざまな入力形状に対してうまく機能する。
論文 参考訳(メタデータ) (2021-06-17T12:25:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。