Fugu-MT 論文翻訳(概要): Together, Then Apart: Revisiting Multimodal Survival Analysis via a Min-Max Perspective

論文の概要: Together, Then Apart: Revisiting Multimodal Survival Analysis via a Min-Max Perspective

arxiv url: http://arxiv.org/abs/2511.18089v1
Date: Sat, 22 Nov 2025 15:10:46 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-25 18:34:24.623316
Title: Together, Then Apart: Revisiting Multimodal Survival Analysis via a Min-Max Perspective
Title（参考訳）: ミニマックス・パースペクティブによるマルチモーダル・サバイバル分析の再考
Authors: Wenjing Liu, Qin Ren, Wen Zhang, Yuewei Lin, Chenyu You,
Abstract要約: この研究は、アライメントと特徴性の二重レンズによる多モードサバイバル分析を再考する。 We introduced Together-Then-Apart, a unified min-max optimization framework that simultaneously models shared and modality-specific representations。我々の定式化は、堅牢で、解釈可能で、生物学的に有意義なマルチモーダルサバイバル分析において、アライメントと特異性をどのように共同で達成できるかという新しい理論的視点を提供する。
参考スコア（独自算出の注目度）: 22.583594870571336
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Integrating heterogeneous modalities such as histopathology and genomics is central to advancing survival analysis, yet most existing methods prioritize cross-modal alignment through attention-based fusion mechanisms, often at the expense of modality-specific characteristics. This overemphasis on alignment leads to representation collapse and reduced diversity. In this work, we revisit multi-modal survival analysis via the dual lens of alignment and distinctiveness, positing that preserving modality-specific structure is as vital as achieving semantic coherence. In this paper, we introduce Together-Then-Apart (TTA), a unified min-max optimization framework that simultaneously models shared and modality-specific representations. The Together stage minimizes semantic discrepancies by aligning embeddings via shared prototypes, guided by an unbalanced optimal transport objective that adaptively highlights informative tokens. The Apart stage maximizes representational diversity through modality anchors and a contrastive regularizer that preserve unique modality information and prevent feature collapse. Extensive experiments on five TCGA benchmarks show that TTA consistently outperforms state-of-the-art methods. Beyond empirical gains, our formulation provides a new theoretical perspective of how alignment and distinctiveness can be jointly achieved in for robust, interpretable, and biologically meaningful multi-modal survival analysis.
Abstract（参考訳）: 病理学やゲノミクスのような異質なモダリティを統合することは生存分析の進歩の中心であるが、既存のほとんどの手法は注意に基づく融合機構を通じて、しばしばモダリティ固有の特性を犠牲にして、異質なアライメントを優先している。このアライメントに対する過剰な強調は、表現の崩壊と多様性の低下につながる。本研究では,多モードサバイバル解析をアライメントと特異性の二重レンズを用いて再検討し,モダリティ固有の構造を保存することは意味的コヒーレンスを達成するのと同じくらい重要であることを示唆する。本稿では,共有表現とモダリティ固有表現を同時にモデル化する,統合されたmin-max最適化フレームワークである Together-Then-Apart (TTA) を紹介する。 Togetherステージは、情報トークンを適応的に強調する不均衡な最適な輸送目標によって導かれる、共有プロトタイプを介して埋め込みを調整することで、セマンティックな差異を最小限に抑える。 Apartステージは、モダリティアンカーと、ユニークなモダリティ情報を保持し、特徴の崩壊を防ぐコントラストレギュレータによって、表現の多様性を最大化する。 TCGAベンチマーク5つの大規模な実験は、TTAが最先端の手法を一貫して上回っていることを示している。経験的ゲイン以外にも、我々の定式化は、堅牢で解釈可能で生物学的に有意義なマルチモーダルサバイバル分析において、アライメントと特異性をどのように共同で達成できるかという新しい理論的な視点を提供する。

関連論文リスト

Vision-Language Semantic Aggregation Leveraging Foundation Model for Generalizable Medical Image Segmentation [5.597576681565333]
本稿では,期待最大化(EM)アグリゲーション機構とテキストガイド付きPixelデコーダを提案する。後者は、ドメイン不変のテキスト知識を利用して、深い視覚的表現を効果的に導くことによって、意味的ギャップを埋めるように設計されている。提案手法は,複数の領域一般化ベンチマークにおいて,既存のSOTA手法より一貫して優れている。
論文参考訳（メタデータ） (2025-09-10T13:16:30Z)
MurreNet: Modeling Holistic Multimodal Interactions Between Histopathology and Genomic Profiles for Survival Prediction [5.895727565919295]
本稿では,MurreNet(マルチモーダル表現デカップリングネットワーク)を提案する。 MurreNetはペア化された入力データをモダリティ固有表現とモダリティ共有表現に分解し、モダリティ間の冗長性を減少させる。 6つのTCGA癌コホートで行った実験は、MurreNetが生存予測において最先端(SOTA)のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2025-07-07T11:26:29Z)
DecAlign: Hierarchical Cross-Modal Alignment for Decoupled Multimodal Representation Learning [18.066105354135058]
マルチモーダル表現学習は、複数のモーダルをまたいだ共有情報と相補的セマンティック情報の両方をキャプチャすることを目的としている。マルチモーダル表現をモダリティ・ユニク(異種)とモダリティ・コモン(異種)に分離するために設計された,新しい階層的クロスモーダルアライメントフレームワークであるDecAlignを紹介する。広く使われている4つのマルチモーダルベンチマーク実験により、DecAlignは既存の最先端手法を一貫して上回っていることが示された。
論文参考訳（メタデータ） (2025-03-14T21:47:48Z)
MIRROR: Multi-Modal Pathological Self-Supervised Representation Learning via Modality Alignment and Retention [57.044719143401664]
病理組織学と転写学は、腫瘍学の基本的なモダリティであり、疾患の形態学的および分子的側面を包含している。モーダルアライメントと保持を両立させる新しいマルチモーダル表現学習法であるMIRRORを提案する。がんの亜型化と生存分析のためのTCGAコホートに関する広範囲な評価は,MIRRORの優れた性能を浮き彫りにしている。
論文参考訳（メタデータ） (2025-03-01T07:02:30Z)
Asynchronous Multimodal Video Sequence Fusion via Learning Modality-Exclusive and -Agnostic Representations [19.731611716111566]
本稿では,モダリティ学習のためのマルチモーダル融合手法を提案する。我々は、モーダル内の信頼性のあるコンテキストダイナミクスをキャプチャする予測的自己アテンションモジュールを導入する。階層的クロスモーダルアテンションモジュールは、モダリティ間の価値ある要素相関を探索するために設計されている。両識別器戦略が提示され、異なる表現を敵対的に生成することを保証する。
論文参考訳（メタデータ） (2024-07-06T04:36:48Z)
Enhancing Multimodal Unified Representations for Cross Modal Generalization [52.16653133604068]
我々は、コードブック(TOC)のトレーニング不要最適化と、FCID(Fin and Coarse Cross-modal Information Disentangling)を提案する。これらの方法は、各モードの特定の特性に合わせて、事前学習から統一された離散表現を洗練し、きめ細かな情報と粗い情報の絡み合わせを行う。
論文参考訳（メタデータ） (2024-03-08T09:16:47Z)
MISA: Modality-Invariant and -Specific Representations for Multimodal Sentiment Analysis [48.776247141839875]
本稿では,2つの異なる部分空間に各モダリティを投影する新しいフレームワーク MISA を提案する。最初の部分空間はモダリティ不変(modality-invariant)であり、モダリティにまたがる表現はその共通点を学び、モダリティギャップを減少させる。一般的な感情分析ベンチマークであるMOSIとMOSEIの実験は、最先端モデルよりも大幅に向上したことを示す。
論文参考訳（メタデータ） (2020-05-07T15:13:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。