論文の概要: MorphSeek: Fine-grained Latent Representation-Level Policy Optimization for Deformable Image Registration
- arxiv url: http://arxiv.org/abs/2511.17392v1
- Date: Fri, 21 Nov 2025 16:52:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.120765
- Title: MorphSeek: Fine-grained Latent Representation-Level Policy Optimization for Deformable Image Registration
- Title(参考訳): MorphSeek: 変形可能な画像登録のための微粒な潜在表現-レベルポリシー最適化
- Authors: Runxun Zhang, Yizhou Liu, Li Dongrui, Bo XU, Jingwei Wei,
- Abstract要約: 変形可能な画像登録は、医用画像解析において基本的な問題であるが難しい問題である。
MorphSeekは、DIRを潜在特徴空間における空間的に連続的な最適化プロセスとして再構成する。
競合するベースラインよりも一貫したDiceの改善を実現し、最小パラメータコストと低ステップレベルのレイテンシで高いラベル効率を維持する。
- 参考スコア(独自算出の注目度): 6.430696214380013
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deformable image registration (DIR) remains a fundamental yet challenging problem in medical image analysis, largely due to the prohibitively high-dimensional deformation space of dense displacement fields and the scarcity of voxel-level supervision. Existing reinforcement learning frameworks often project this space into coarse, low-dimensional representations, limiting their ability to capture spatially variant deformations. We propose MorphSeek, a fine-grained representation-level policy optimization paradigm that reformulates DIR as a spatially continuous optimization process in the latent feature space. MorphSeek introduces a stochastic Gaussian policy head atop the encoder to model a distribution over latent features, facilitating efficient exploration and coarse-to-fine refinement. The framework integrates unsupervised warm-up with weakly supervised fine-tuning through Group Relative Policy Optimization, where multi-trajectory sampling stabilizes training and improves label efficiency. Across three 3D registration benchmarks (OASIS brain MRI, LiTS liver CT, and Abdomen MR-CT), MorphSeek achieves consistent Dice improvements over competitive baselines while maintaining high label efficiency with minimal parameter cost and low step-level latency overhead. Beyond optimizer specifics, MorphSeek advances a representation-level policy learning paradigm that achieves spatially coherent and data-efficient deformation optimization, offering a principled, backbone-agnostic, and optimizer-agnostic solution for scalable visual alignment in high-dimensional settings.
- Abstract(参考訳): 変形可能な画像登録(DIR)は、高密度変位場の高次元の変形空間と、ボクセルレベルの監督の欠如により、医用画像解析において根本的かつ困難な問題である。
既存の強化学習フレームワークは、しばしばこの空間を粗く低次元の表現に投影し、空間的に変化する変形を捉える能力を制限する。
我々は,DIRを潜在特徴空間における空間的に連続的な最適化プロセスとして再構成する,詳細な表現レベルポリシー最適化パラダイムであるMorphSeekを提案する。
MorphSeekは、エンコーダの上に確率的なガウスポリシーのヘッドを導入し、潜伏する特徴の分布をモデル化し、効率的な探索と粗い微細化を容易にする。
このフレームワークは、教師なしウォームアップと、グループ相対ポリシー最適化を通じて弱教師付き微調整を統合し、多軌道サンプリングはトレーニングを安定化し、ラベル効率を向上させる。
3つの3Dレジストレーションベンチマーク(OASIS 脳MRI、LiTS肝CT、Abdomen MR-CT)の中で、MorphSeekは競合ベースラインよりも一貫したDiceの改善を実現し、パラメータコストの最小化とステップレベルの遅延オーバーヘッドの低減を実現している。
MorphSeekは、オプティマイザ仕様以外にも、空間的コヒーレントでデータ効率のよい変形最適化を実現する表現レベルポリシー学習パラダイムを推進し、高次元設定におけるスケーラブルな視覚的アライメントのための、原則付き、バックボーン非依存、およびオプティマイザ非依存のソリューションを提供する。
関連論文リスト
- From Tokens to Nodes: Semantic-Guided Motion Control for Dynamic 3D Gaussian Splatting [26.57713792657793]
制御密度と動きの複雑さを一致させる動き適応フレームワークを提案する。
既存の最先端手法に比べて,復元品質と効率が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2025-10-03T05:33:58Z) - Towards Efficient General Feature Prediction in Masked Skeleton Modeling [59.46799426434277]
マスクスケルトンモデリングのための新しい汎用特徴予測フレームワーク(GFP)を提案する。
我々の重要な革新は、局所的な動きパターンからグローバルな意味表現にまたがる、従来の低レベルな再構築を高レベルな特徴予測に置き換えることです。
論文 参考訳(メタデータ) (2025-09-03T18:05:02Z) - Intern-GS: Vision Model Guided Sparse-View 3D Gaussian Splatting [95.61137026932062]
Intern-GSはスパースビューガウススプラッティングのプロセスを強化する新しいアプローチである。
Intern-GSは多様なデータセットにまたがって最先端のレンダリング品質を実現する。
論文 参考訳(メタデータ) (2025-05-27T05:17:49Z) - MCGS: Multiview Consistency Enhancement for Sparse-View 3D Gaussian Radiance Fields [100.90743697473232]
3Dガウシアンによって表現される放射場は、高いトレーニング効率と高速レンダリングの両方を提供する、新しいビューの合成に優れている。
既存の手法では、高密度推定ネットワークからの奥行き先を組み込むことが多いが、入力画像に固有の多視点一貫性を見落としている。
スパースビューからのシーン再構成が可能な3次元ガウススプラッティングに基づくビュー合成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T08:39:05Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - HGSLoc: 3DGS-based Heuristic Camera Pose Refinement [13.393035855468428]
HGSLocは、新しい軽量なプラグアンドプレイポーズ最適化フレームワークである。
3次元再構成と精細化戦略を統合して、より高いポーズ推定精度を実現する。
提案手法は,NeRFを用いたニューラルローカライゼーション手法と比較して高い位置推定精度を示す。
論文 参考訳(メタデータ) (2024-09-17T06:48:48Z) - Dynamic Kernel-Based Adaptive Spatial Aggregation for Learned Image
Compression [63.56922682378755]
本稿では,空間アグリゲーション機能の拡張に焦点をあて,動的カーネルベースの変換符号化を提案する。
提案したアダプティブアグリゲーションはカーネルオフセットを生成し、コンテント条件付き範囲の有効な情報をキャプチャして変換を支援する。
実験により,本手法は,最先端の学習手法と比較して,3つのベンチマークにおいて高い速度歪み性能が得られることを示した。
論文 参考訳(メタデータ) (2023-08-17T01:34:51Z) - Break a Lag: Triple Exponential Moving Average for Enhanced Optimization [2.0199251985015434]
本稿では,三重指数移動平均のパワーを利用する新しい最適化手法であるFAMEを紹介する。
FAMEはデータダイナミクスに対する応答性を高め、トレンド識別ラグを緩和し、学習効率を最適化する。
包括的評価は、画像分類、オブジェクト検出、セマンティックセグメンテーションを含む様々なコンピュータビジョンタスクを含み、FAMEを30の異なるアーキテクチャに統合する。
論文 参考訳(メタデータ) (2023-06-02T10:29:33Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。