論文の概要: SAMamba3D: adapting Segment Anything for generalizable 3D segmentation of multiphase pore-scale images
- arxiv url: http://arxiv.org/abs/2605.00916v1
- Date: Wed, 29 Apr 2026 15:27:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.480496
- Title: SAMamba3D: adapting Segment Anything for generalizable 3D segmentation of multiphase pore-scale images
- Title(参考訳): SAMamba3D:多相間隙スケール画像の一般化可能な3次元分割のためのセグメンテーションの適応
- Authors: Rui Zhang, Xianzhi Song, Linqi Zhu, Branko Bijeljic, Gensheng Li, Martin J. Blunt,
- Abstract要約: 本稿では,広く凍結されたSAMエンコーダを一般化可能な3次元細孔スケールセグメンテーションに適応させるパラメータ効率のフレームワークSAMamba3Dを提案する。
異なる流体を持つ砂岩と炭酸塩では、SAMamba3Dは現在の3Dベースラインにマッチしたり、性能を上回ります。
その結果、セグメント化されたイメージは、流体飽和、接続性、インターフェイス形態など、物理的に意味のある記述子を保存する。
- 参考スコア(独自算出の注目度): 3.404161505115781
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable segmentation of multiphase pore-scale X-ray images of rocks is necessary to quantify fluid saturation, connectivity, and interfacial geometry. However, current 3D segmentation methods are typically dataset-specific, requiring retraining or extensive fine-tuning whenever rock type, fluid pattern, scanner, or acquisition conditions change. Foundation models such as the Segment Anything Model (SAM) provide strong 2D boundary priors, but they are not directly applicable to 3D data. We present SAMamba3D, a parameter-efficient framework that adapts a largely frozen SAM encoder to generalizable 3D pore-scale segmentation by coupling it with Mamba-based volumetric context modeling and progressive cross-scale feature interaction. For sandstone and carbonate datasets, with different fluids, wettability, and scanning conditions, SAMamba3D matches or outperforms current 3D baselines while reducing the need for case-specific retraining. The resulting segmented images preserve physically meaningful descriptors, including fluid saturation, connectivity, and interface morphology, enabling more reliable and rapid analysis of large 3D multiphase images.
- Abstract(参考訳): 流体飽和度, 接続性, 界面形状を定量化するためには, 岩石の多相細孔スケールX線像の信頼性セグメンテーションが必要である。
しかし、現在の3Dセグメンテーション法は一般的にデータセットに特化しており、ロックタイプ、流体パターン、スキャナー、取得条件が変わるたびに、再トレーニングや広範囲な微調整が必要となる。
Segment Anything Model (SAM) のような基礎モデルでは、強い2D境界が与えられるが、3Dデータには直接適用できない。
SAMamba3Dは,Mambaベースのボリュームコンテキストモデリングとプログレッシブなクロススケール特徴相互作用とを結合することにより,大きく凍結されたSAMエンコーダを一般化可能な3次元細孔スケールセグメンテーションに適応させるパラメータ効率のよいフレームワークである。
異なる流体、濡れ性、走査条件を持つ砂岩と炭酸塩のデータセットでは、SAMamba3Dはケース固有の再トレーニングの必要性を減らしながら、現在の3Dベースラインにマッチまたは性能を向上する。
得られたセグメント化された画像は、流体飽和、接続性、界面形態など、物理的に意味のある記述子を保持し、大きな3次元多相画像の信頼性と迅速な解析を可能にする。
関連論文リスト
- Towards Realistic and Consistent Orbital Video Generation via 3D Foundation Priors [61.34273238077091]
本稿では,物体の単一画像からオービタルビデオを生成する新しい手法を提案する。
本手法は,最先端の手法と比較して,視覚的品質,形状リアリズム,多視点整合性を実現している。
論文 参考訳(メタデータ) (2026-04-14T05:35:46Z) - MV-SAM: Multi-view Promptable Segmentation using Pointmap Guidance [79.57732829495843]
本稿では,ポイントマップを用いた3次元一貫性を実現する多視点セグメンテーションフレームワークMV-SAMを紹介する。
MV-SAMは画像を持ち上げて3D空間にプロンプトし、明示的な3Dネットワークや注釈付き3Dデータを必要としない。
論文 参考訳(メタデータ) (2026-01-25T15:00:37Z) - Visual Odometry with Transformers [68.453547770334]
特徴抽出により単眼フレームのシーケンスを処理するビジュアル・オドメトリ・トランスフォーマ(VoT)を導入する。
従来の方法とは異なり、VoTは密度の高い幾何学を推定することなくカメラの動きを直接予測し、監視のためにカメラのポーズのみに依存する。
VoTは、より大きなデータセットで効果的にスケールし、より強力なトレーニング済みバックボーンの恩恵を受け、多様なカメラモーションとキャリブレーション設定を一般化し、従来のメソッドよりも3倍以上高速に動作しながらパフォーマンスを向上する。
論文 参考訳(メタデータ) (2025-10-02T17:00:14Z) - Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - Few-Shot 3D Volumetric Segmentation with Multi-Surrogate Fusion [31.736235596070937]
軽量マルチサロゲート融合(MSF)を用いた新しい3DセグメンテーションフレームワークMSFSegを提案する。
MSFSegは、1つまたは数個の注釈付き2Dスライスまたは3Dシーケンスセグメントを備えた、目に見えない3Dオブジェクト/組織(トレーニング中)を自動的に分割することができる。
提案するMSFモジュールは, ラベル付きスライスと少数のラベル付きスライス/シーケンス間の包括的および多彩な相関関係を, 複数の指定されたサロゲートを介して抽出する。
論文 参考訳(メタデータ) (2024-08-26T17:15:37Z) - View-Consistent Hierarchical 3D Segmentation Using Ultrametric Feature Fields [52.08335264414515]
我々は3次元シーンを表すニューラル・レージアンス・フィールド(NeRF)内の新しい特徴場を学習する。
本手法は、ビュー一貫性の多粒性2Dセグメンテーションを入力とし、3D一貫性のセグメンテーションの階層構造を出力として生成する。
提案手法と,多視点画像と多粒性セグメンテーションを用いた合成データセットのベースラインの評価を行い,精度と視点整合性を向上したことを示す。
論文 参考訳(メタデータ) (2024-05-30T04:14:58Z) - SegFormer3D: an Efficient Transformer for 3D Medical Image Segmentation [0.13654846342364302]
マルチスケールボリューム機能にまたがる注目度を算出する階層変換器であるSegFormer3Dを提案する。
SegFormer3Dは複雑なデコーダを避け、全MLPデコーダを使用して、ローカルおよびグローバルなアテンション機能を集約する。
広く使われている3つのデータセット上で、現在のSOTAモデルに対してSegFormer3Dをベンチマークする。
論文 参考訳(メタデータ) (2024-04-15T22:12:05Z) - Spatiotemporal Modeling Encounters 3D Medical Image Analysis:
Slice-Shift UNet with Multi-View Fusion [0.0]
本稿では,2次元CNNにおける3次元特徴をエンコードする2次元モデルSlice SHift UNetを提案する。
より正確にマルチビュー機能は、ボリュームの3次元平面に沿って2次元の畳み込みを実行することで協調的に学習される。
提案手法の有効性は,多モード腹部多臓器軸 (AMOS) と Cranial Vault (BTCV) データセットを越えたマルチアトラスラベリング (Multi-Atlas Labeling Beyond the Cranial Vault) で検証した。
論文 参考訳(メタデータ) (2023-07-24T14:53:23Z) - Spatial Context-Aware Self-Attention Model For Multi-Organ Segmentation [18.76436457395804]
マルチ組織セグメンテーションは、医学画像解析におけるディープラーニングの最も成功した応用の1つである。
深部畳み込みニューラルネット(CNN)は,CT画像やMRI画像上で臨床応用画像のセグメンテーション性能を達成する上で非常に有望である。
本研究では,高分解能2次元畳み込みによりセグメンテーションを実現する3次元モデルと2次元モデルを組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-12-16T21:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。