Fugu-MT 論文翻訳(概要): Rhamba: Region-Aware Hybrid Attention-Mamba Framework for Self-Supervised Learning in Resting-State fMRI

論文の概要: Rhamba: Region-Aware Hybrid Attention-Mamba Framework for Self-Supervised Learning in Resting-State fMRI

arxiv url: http://arxiv.org/abs/2605.01240v2
Date: Fri, 08 May 2026 03:44:47 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-11 16:31:22.621045
Title: Rhamba: Region-Aware Hybrid Attention-Mamba Framework for Self-Supervised Learning in Resting-State fMRI
Title（参考訳）: Rhamba: 静止状態fMRIにおける自己教師付き学習のための地域対応ハイブリッドアテンション・マンバフレームワーク
Authors: Ruthwik Reddy Doodipala, Pankaj Pandey, Pratheek Eranki, Carolina Torres-Rojas, Manob Jyoti Saikia, Ranganatha Sitaram,
Abstract要約: Rhambaは、ガイドマスクとハイブリッドアテンション・マンバアーキテクチャを統合してfMRI分析を行う、地域対応事前トレーニングフレームワークである。モデルはABIDEデータセット上で、領域整合パッチ埋め込みと3つのマスキング戦略を用いて事前訓練された。マスキングの戦略は再建行動に強く影響を与え、一貫した順序で再建の損失を被った。
参考スコア（独自算出の注目度）: 0.740086377920449
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Self-supervised pretraining is promising for large-scale neuroimaging, yet the impact of region-aware masking and hybrid sequence modeling remains underexplored. In this work, we introduce Rhamba, a region-aware pretraining framework that integrates anatomically guided masking with hybrid Attention-Mamba architectures for resting state functional magnetic resonance imaging (fMRI) analysis. Models were pretrained on the ABIDE dataset using region-aligned patch embeddings and three masking strategies (Any, Majority, and Pure) with increasing spatial specificity. We evaluated four architectural variants: a Mamba only model, an Alternate architecture with interleaved Mamba and Attention blocks, and two hybrid encoder-decoder configurations (Attention-Mamba (AM) and Mamba-Attention (MA)). The pretrained models were fine-tuned on downstream classification tasks using the COBRE and ADHD-200 datasets for schizophrenia and attention-deficit/hyperactivity disorder discrimination. We employed Integrated Gradients, an explainable AI method, to identify the brain regions contributing to model predictions. Masking strategy strongly influenced reconstruction behavior, with reconstruction loss following a consistent ordering (Any > Majority > Pure). However, this trend did not directly translate into downstream performance, where differences were modest and dataset-dependent. The hybrid architecture with the MA configuration achieved the highest average AUROC across both datasets, and Rhamba outperformed state-of-the-art methods in comparative evaluation. Region-wise analysis showed that peak performance depends on the interaction between masking strategy and architecture rather than a single dominant configuration. Overall, Rhamba offers a flexible framework for balancing interpretability, scalability, and performance in large-scale fMRI representation learning.
Abstract（参考訳）: 自己監督型プレトレーニングは大規模なニューロイメージングには有望であるが、領域認識型マスキングとハイブリッドシーケンスモデリングの影響はいまだ検討されていない。本研究では,解剖学的にガイドされたマスキングとハイブリッドアテンション・マンバアーキテクチャを統合した領域認識事前トレーニングフレームワークであるRhambaを紹介した。領域整合パッチ埋め込みと3つのマスキング戦略(Any,Majority,Pure)を用いて,ABIDEデータセット上で事前学習を行った。我々は,Mamba のみのモデルと,インターリーブされた Mamba と Attention ブロックを備えた Alternate アーキテクチャ,および2つのハイブリッドエンコーダデコーダ構成 (Attention-Mamba (AM) と Mamba-Attention (MA)) を評価した。プレトレーニングされたモデルは、統合失調症と注意欠陥・高活動障害の識別のためにCOBREとADHD-200データセットを使用して下流分類タスクを微調整した。我々は、モデル予測に寄与する脳領域を特定するために、説明可能なAI手法であるIntegrated Gradientsを採用した。マスキング戦略は再建行動に強く影響し, 一貫した順序(Any > Majority > Pure)による再建の損失が生じた。しかし、この傾向は、違いが穏やかでデータセットに依存した下流のパフォーマンスに直接変換されなかった。 MA構成のハイブリッドアーキテクチャは、両方のデータセットで平均的なAUROCを達成し、Rhambaは比較評価において最先端の手法を上回った。リージョンワイズ分析により、ピークパフォーマンスは単一の支配的な構成ではなく、マスキング戦略とアーキテクチャ間の相互作用に依存することが示された。全体として、Rhambaは大規模なfMRI表現学習において、解釈可能性、スケーラビリティ、パフォーマンスのバランスをとる柔軟なフレームワークを提供する。

関連論文リスト

MambaBack: Bridging Local Features and Global Contexts in Whole Slide Image Analysis [8.432035888211212]
Whole Slide Image (WSI) 解析は、形態学と建築学を統合したがん診断を可能にする計算病理学において重要な要素である。マルチインスタンス学習(MIL)は、WSI分析の標準フレームワークとして機能します。 MILアプローチは,(1)1次元配列平坦化中の2次元空間的局所性の破壊,(2)微細な局所細胞構造の最適部分モデリング,(3)推論時の高記憶ピークの3つの重要な課題に直面している。我々は,MambaとMambaOutの強みを調和させる新しいハイブリッドアーキテクチャであるMambaBackを提案する。
論文参考訳（メタデータ） (2026-04-17T06:08:37Z)
A Hybrid Architecture for Benign-Malignant Classification of Mammography ROIs [7.489722641968593]
本稿では,ローカル特徴抽出のためのEfficientNetV2-Mと,効率的なグローバルコンテキストモデリングのためのVision Mambaを組み合わせたハイブリッドアーキテクチャを提案する。強いCNNバックボーンと線形複雑配列モデルを組み合わせることで、強い病変レベルの分類性能を実現する。
論文参考訳（メタデータ） (2026-04-14T08:28:21Z)
SoliReward: Mitigating Susceptibility to Reward Hacking and Annotation Noise in Video Generation Reward Models [53.19726629537694]
ビデオ生成モデルと人間の好みのトレーニング後のアライメントは、重要な目標である。現在のデータ収集パラダイムは、プロンプト内のペアワイズアノテーションに依存しており、ノイズのラベル付けに悩まされている。ビデオRMトレーニングのための体系的フレームワークであるSoliRewardを提案する。
論文参考訳（メタデータ） (2025-12-17T14:28:23Z)
Mixture of Ranks with Degradation-Aware Routing for One-Step Real-World Image Super-Resolution [76.66229730098759]
実世界の画像超解像(Real-ISR)では、既存のアプローチは主に微調整された事前学習拡散モデルに依存している。単一ステップ画像超解像のためのMixture-of-Ranks (MoR)アーキテクチャを提案する。 LoRAの各ランクを独立した専門家として扱う、きめ細かい専門家分割戦略を導入する。
論文参考訳（メタデータ） (2025-11-20T04:11:44Z)
Differential-UMamba: Rethinking Tumor Segmentation Under Limited Data Scenarios [3.1231963031043786]
Diff-UMambaは、UNetフレームワークとmambaメカニズムを組み合わせて長距離依存関係をモデル化する新しいアーキテクチャである。 Diff-UMambaの中心部にはノイズ低減モジュールがあり、ノイズや無関係なアクティベーションを抑制するための信号差分戦略を採用している。このアーキテクチャは、特に低データ設定において、セグメンテーションの精度と堅牢性を改善する。
論文参考訳（メタデータ） (2025-07-24T08:23:11Z)
VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文参考訳（メタデータ） (2025-05-02T12:21:44Z)
MambaMoE: Mixture-of-Spectral-Spatial-Experts State Space Model for Hyperspectral Image Classification [46.67137351665963]
マンバをベースとしたモデルは、最近ハイパースペクトル画像(HSI)分類において有意な可能性を証明している。我々は,HSI分類領域における最初のMoEに基づくアプローチである,スペクトル空間混合(MoE)フレームワークであるMambaMoEを提案する。 MambaMoEは、既存の高度な手法と比較して、分類精度と計算効率の両面で最先端の性能を達成する。
論文参考訳（メタデータ） (2025-04-29T07:50:36Z)
DiM-Gesture: Co-Speech Gesture Generation with Adaptive Layer Normalization Mamba-2 framework [2.187990941788468]
生音声のみから、高度にパーソナライズされた3Dフルボディジェスチャーを作成するために作られた生成モデル。 Modelは、Mambaベースのファジィ特徴抽出器と非自己回帰適応層正規化(AdaLN)Mamba-2拡散アーキテクチャを統合している。
論文参考訳（メタデータ） (2024-08-01T08:22:47Z)
ARHNet: Adaptive Region Harmonization for Lesion-aware Augmentation to Improve Segmentation Performance [61.04246102067351]
本研究では,合成画像をよりリアルに見せるために,前景調和フレームワーク(ARHNet)を提案する。実画像と合成画像を用いたセグメンテーション性能の向上に本手法の有効性を実証する。
論文参考訳（メタデータ） (2023-07-02T10:39:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。