論文の概要: Shape-Adapting Gated Experts: Dynamic Expert Routing for Colonoscopic Lesion Segmentation
- arxiv url: http://arxiv.org/abs/2511.18493v1
- Date: Sun, 23 Nov 2025 15:25:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.866363
- Title: Shape-Adapting Gated Experts: Dynamic Expert Routing for Colonoscopic Lesion Segmentation
- Title(参考訳): 形状適応型ゲーテッドエキスパート:内視鏡的病変分割のための動的エキスパートルーティング
- Authors: Gia Huy Thai, Hoang-Nguyen Vu, Anh-Minh Phan, Quang-Thinh Ly, Tram Dinh, Thi-Ngoc-Truc Nguyen, Nhat Ho,
- Abstract要約: Shape-Adapting Gated Experts (SAGE)は、ビジュアルネットワークにおける動的エキスパートルーティングを可能にする入力適応フレームワークである。
SAGEは動的エキスパートルーティングのためのスケーラブルな基盤を提供し、柔軟な視覚的推論を可能にする。
- 参考スコア(独自算出の注目度): 35.18016233072556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The substantial diversity in cell scale and form remains a primary challenge in computer-aided cancer detection on gigapixel Whole Slide Images (WSIs), attributable to cellular heterogeneity. Existing CNN-Transformer hybrids rely on static computation graphs with fixed routing, which consequently causes redundant computation and limits their adaptability to input variability. We propose Shape-Adapting Gated Experts (SAGE), an input-adaptive framework that enables dynamic expert routing in heterogeneous visual networks. SAGE reconfigures static backbones into dynamically routed expert architectures. SAGE's dual-path design features a backbone stream that preserves representation and selectively activates an expert path through hierarchical gating. This gating mechanism operates at multiple hierarchical levels, performing a two-level, hierarchical selection between shared and specialized experts to modulate model logits for Top-K activation. Our Shape-Adapting Hub (SA-Hub) harmonizes structural and semantic representations across the CNN and the Transformer module, effectively bridging diverse modules. Embodied as SAGE-UNet, our model achieves superior segmentation on three medical benchmarks: EBHI, DigestPath, and GlaS, yielding state-of-the-art Dice Scores of 95.57%, 95.16%, and 94.17%, respectively, and robustly generalizes across domains by adaptively balancing local refinement and global context. SAGE provides a scalable foundation for dynamic expert routing, enabling flexible visual reasoning.
- Abstract(参考訳): 細胞規模と形態のかなりの多様性は、細胞不均一性に起因するギガピクセル全スライド画像(WSI)におけるコンピュータ支援がん検出において、依然として主要な課題である。
既存のCNN-Transformerハイブリッドは固定ルーティングを持つ静的な計算グラフに依存しており、結果として冗長な計算が発生し、入力変数への適応性が制限される。
異種視覚ネットワークにおける動的エキスパートルーティングを実現するための入力適応フレームワークであるShape-Adapting Gated Experts (SAGE)を提案する。
SAGEは静的バックボーンを動的にルーティングされたエキスパートアーキテクチャに再構成する。
SAGEのデュアルパス設計は、表現を保存し、階層的なゲーティングを通じてエキスパートパスを選択的に活性化するバックボーンストリームを備えている。
このゲーティング機構は複数の階層レベルで動作し、Top-Kアクティベーションのためのモデルロジットを変調するために、共有専門家と専門専門家の間で2段階の階層的選択を行う。
私たちのShape-Adapting Hub(SA-Hub)は、CNNとTransformerモジュール間の構造的および意味的表現を調和させ、多様なモジュールを効果的にブリッジします。
SAGE-UNetと呼ばれる我々のモデルは、EBHI、DigestPath、GlaSの3つの医学ベンチマークにおいて優れたセグメンテーションを達成し、それぞれ95.57%、95.16%、94.17%の最先端のDiceスコアを獲得し、局所的な洗練とグローバルなコンテキストを適応的にバランスさせることで、ドメイン間の堅牢な一般化を実現している。
SAGEは動的エキスパートルーティングのためのスケーラブルな基盤を提供し、柔軟な視覚的推論を可能にする。
関連論文リスト
- Hierarchical Graph Feature Enhancement with Adaptive Frequency Modulation for Visual Recognition [6.580655899524989]
畳み込みニューラルネットワーク(CNN)は、視覚認識タスクにおいて強力な性能を示している。
構造認識と特徴表現を両立させるため,CNNにグラフベース推論を統合する新しいフレームワークを提案する。
提案したHGFEモジュールは軽量でエンドツーエンドのトレーニングが可能で、標準のCNNバックボーンネットワークにシームレスに統合できる。
論文 参考訳(メタデータ) (2025-08-15T14:19:50Z) - GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - PathFL: Multi-Alignment Federated Learning for Pathology Image Segmentation [40.87628787589962]
病理画像セグメンテーションのための新しいフェデレートラーニングフレームワークPathFLを提案する。
PathFLは、画像、特徴、モデルアグリゲーションの3段階のアライメント戦略を通じて、課題に対処する。
論文 参考訳(メタデータ) (2025-05-28T16:09:02Z) - Adaptive Integrated Layered Attention (AILA) [0.0]
本稿では,ニューラルネットワークアーキテクチャであるAdaptive Layered Integrated Attention (AILA)を提案する。
各種商品・指標の価格予測,CIFAR-10データセットを用いた画像認識,IMDB映画レビューデータセットの感情分析の3つの課題についてAILAを評価した。
その結果、AILAの適応層間接続は、複数のネットワーク深さで関連する特徴を柔軟に再利用することで、堅牢な利得が得られることを確認した。
論文 参考訳(メタデータ) (2025-03-26T19:32:31Z) - Rich CNN-Transformer Feature Aggregation Networks for Super-Resolution [50.10987776141901]
近年の視覚変換器と自己注意は,様々なコンピュータビジョンタスクにおいて有望な成果を上げている。
我々は,CNNの局所的特徴とトランスフォーマーが捉えた長距離依存性を活用する,超解像(SR)タスクのための効果的なハイブリッドアーキテクチャを提案する。
提案手法は,多数のベンチマークデータセットから最先端のSR結果を得る。
論文 参考訳(メタデータ) (2022-03-15T06:52:25Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。