論文の概要: Insertion Network for Image Sequence Correspondence
- arxiv url: http://arxiv.org/abs/2602.12489v1
- Date: Fri, 13 Feb 2026 00:04:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:53.795054
- Title: Insertion Network for Image Sequence Correspondence
- Title(参考訳): 画像系列対応のための挿入ネットワーク
- Authors: Dingjie Su, Weixiang Hong, Benoit M. Dawant, Bennett A. Landman,
- Abstract要約: 2次元画像の2つのシーケンス間の対応性を確立するための新しい手法を提案する。
目標は、特定の2Dスライスを3Dボリューム内にローカライズするか、またはその2Dスライスに基づいて3Dスキャンの解剖学的カバレッジを決定することである。
提案手法は,ネットワークをトレーニングし,あるシーケンスからのスライスを他のシーケンスの適切な位置に挿入する方法を学ぶことによってシーケンス対応を構築する。
- 参考スコア(独自算出の注目度): 4.151041726428026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel method for establishing correspondence between two sequences of 2D images. One particular application of this technique is slice-level content navigation, where the goal is to localize specific 2D slices within a 3D volume or determine the anatomical coverage of a 3D scan based on its 2D slices. This serves as an important preprocessing step for various diagnostic tasks, as well as for automatic registration and segmentation pipelines. Our approach builds sequence correspondence by training a network to learn how to insert a slice from one sequence into the appropriate position in another. This is achieved by encoding contextual representations of each slice and modeling the insertion process using a slice-to-slice attention mechanism. We apply this method to localize manually labeled key slices in body CT scans and compare its performance to the current state-of-the-art alternative known as body part regression, which predicts anatomical position scores for individual slices. Unlike body part regression, which treats each slice independently, our method leverages contextual information from the entire sequence. Experimental results show that the insertion network reduces slice localization errors in supervised settings from 8.4 mm to 5.4 mm, demonstrating a substantial improvement in accuracy.
- Abstract(参考訳): 2次元画像の2つのシーケンス間の対応性を確立するための新しい手法を提案する。
特定の2Dスライスを3Dボリューム内にローカライズするか、あるいはその2Dスライスに基づいて3Dスキャンの解剖学的カバレッジを決定することが目的である。
これは、さまざまな診断タスクや自動登録およびセグメンテーションパイプラインのための重要な前処理ステップとして機能する。
提案手法は,ネットワークをトレーニングし,あるシーケンスからのスライスを他のシーケンスの適切な位置に挿入する方法を学ぶことによってシーケンス対応を構築する。
これは、各スライスの文脈表現を符号化し、スライス・ツー・スライス・アテンション機構を用いて挿入過程をモデル化することで実現される。
本手法は,身体CTスキャンにおいて手動でラベル付けされたキースライスをローカライズし,その性能を,個々のスライスに対する解剖学的位置スコアを予測するボディ部分回帰と呼ばれる最先端の代替品と比較する。
各スライスを個別に扱うボディ部分回帰とは異なり、本手法はシーケンス全体からコンテキスト情報を活用する。
実験の結果,挿入ネットワークは教師付き設定におけるスライス局所化誤差を8.4mmから5.4mmに低減し,精度が大幅に向上した。
関連論文リスト
- Sli2Vol+: Segmenting 3D Medical Images Based on an Object Estimation Guided Correspondence Flow Network [16.909079894023293]
3次元医用画像のアノテーション負担を軽減するために,マスク伝搬DL法を開発した。
しかし, これらの手法は, 復元誤差のスライス間伝播による誤差蓄積の傾向にある。
本研究では,3次元医用画像中の解剖学的構造を1つの注記スライスで分割するSSFを提案する。
論文 参考訳(メタデータ) (2024-11-21T06:15:43Z) - Self-Supervised Alignment Learning for Medical Image Segmentation [26.114595114732644]
医用画像セグメンテーションのためのニューラルネットワークを事前学習するための,新たな自己教師付きアライメント学習フレームワークを提案する。
提案するフレームワークは,新たな局所的なアライメント損失とグローバルな位置損失から構成される。
実験の結果,提案したアライメント学習は,既存のCTおよびMRIデータセットの自己教師付き事前学習手法と競合することが示された。
論文 参考訳(メタデータ) (2024-06-22T00:47:39Z) - ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - CLIP2Scene: Towards Label-efficient 3D Scene Understanding by CLIP [55.864132158596206]
Contrastive Language-Image Pre-Training (CLIP) は、2次元ゼロショットおよび少数ショット学習において有望な結果をもたらす。
私たちは,CLIP知識が3Dシーン理解にどう役立つか,最初の試みを行う。
筆者らは,CLIPの知識を2次元画像テキスト事前学習モデルから3次元ポイント・クラウド・ネットワークに転送するフレームワークであるCLIP2Sceneを提案する。
論文 参考訳(メタデータ) (2023-01-12T10:42:39Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Leveraging Unsupervised Image Registration for Discovery of Landmark
Shape Descriptor [5.40076482533193]
本稿では,画像からランドマークを発見するための自己教師型深層学習手法を提案する。
我々は、ランドマーク駆動のイメージ登録を主要なタスクとして使用し、ニューラルネットワークにイメージを適切に登録するランドマークを見つけるように強制する。
提案手法は分割と前処理を回避し、2D画像や3D画像のみを用いて使用可能な形状記述子を直接生成する。
論文 参考訳(メタデータ) (2021-11-13T01:02:10Z) - TSGCNet: Discriminative Geometric Feature Learning with Two-Stream
GraphConvolutional Network for 3D Dental Model Segmentation [141.2690520327948]
2流グラフ畳み込みネットワーク(TSGCNet)を提案し、異なる幾何学的特性から多視点情報を学ぶ。
3次元口腔内スキャナーで得られた歯科モデルのリアルタイムデータセットを用いてTSGCNetの評価を行った。
論文 参考訳(メタデータ) (2020-12-26T08:02:56Z) - Automatic Segmentation, Localization, and Identification of Vertebrae in
3D CT Images Using Cascaded Convolutional Neural Networks [22.572414102512358]
本稿では, 3次元CT画像における椎骨の自動分割, 局所化, 同定の方法を提案する。
提案手法は,すべてのタスクを仮定なしで単一のマルチステージフレームワークで処理する。
平均Diceスコアは96%,平均定位誤差は8.3mm,平均識別率は84%であった。
論文 参考訳(メタデータ) (2020-09-29T06:11:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。