論文の概要: From Slices to Sequences: Autoregressive Tracking Transformer for Cohesive and Consistent 3D Lymph Node Detection in CT Scans
- arxiv url: http://arxiv.org/abs/2503.07933v2
- Date: Thu, 13 Mar 2025 00:01:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-14 12:09:19.276906
- Title: From Slices to Sequences: Autoregressive Tracking Transformer for Cohesive and Consistent 3D Lymph Node Detection in CT Scans
- Title(参考訳): スライスからシークエンスへ:CTスキャンにおける粘着性および持続性3次元リンパ節検出のための自己回帰追跡変換器
- Authors: Qinji Yu, Yirui Wang, Ke Yan, Dandan Zheng, Dashan Ai, Dazhou Guo, Zhanghexuan Ji, Yanzhou Su, Yun Bian, Na Shen, Xiaowei Ding, Le Lu, Xianghua Ye, Dakai Jin,
- Abstract要約: LN-トラッカー(LN-Tracker)は、関節終端検出と3Dインスタンスアソシエーションのための新しいLN追跡変換器である。
LN-Trackerはトランスフォーマーのデコーダのクエリをトラックと検出グループに分離する。
4つのリンパ節データセットの大規模な評価は、LN-Trackerの優れた性能を示し、他の上位3D/2.5D検出器と比較して、平均的な感度が2.7%向上している。
- 参考スコア(独自算出の注目度): 9.00859316589341
- License:
- Abstract: Lymph node (LN) assessment is an essential task in the routine radiology workflow, providing valuable insights for cancer staging, treatment planning and beyond. Identifying scatteredly-distributed and low-contrast LNs in 3D CT scans is highly challenging, even for experienced clinicians. Previous lesion and LN detection methods demonstrate effectiveness of 2.5D approaches (i.e, using 2D network with multi-slice inputs), leveraging pretrained 2D model weights and showing improved accuracy as compared to separate 2D or 3D detectors. However, slice-based 2.5D detectors do not explicitly model inter-slice consistency for LN as a 3D object, requiring heuristic post-merging steps to generate final 3D LN instances, which can involve tuning a set of parameters for each dataset. In this work, we formulate 3D LN detection as a tracking task and propose LN-Tracker, a novel LN tracking transformer, for joint end-to-end detection and 3D instance association. Built upon DETR-based detector, LN-Tracker decouples transformer decoder's query into the track and detection groups, where the track query autoregressively follows previously tracked LN instances along the z-axis of a CT scan. We design a new transformer decoder with masked attention module to align track query's content to the context of current slice, meanwhile preserving detection query's high accuracy in current slice. An inter-slice similarity loss is introduced to encourage cohesive LN association between slices. Extensive evaluation on four lymph node datasets shows LN-Tracker's superior performance, with at least 2.7% gain in average sensitivity when compared to other top 3D/2.5D detectors. Further validation on public lung nodule and prostate tumor detection tasks confirms the generalizability of LN-Tracker as it achieves top performance on both tasks.
- Abstract(参考訳): LN(Lymph node)アセスメントは、定期的な放射線学ワークフローにおいて必須の課題であり、がんのステージングや治療計画などに対する貴重な洞察を提供する。
3次元CT画像における散乱分散低コントラストLNの同定は非常に困難である。
従来の病変およびLN検出法は2.5Dアプローチ(つまり、マルチスライス入力を持つ2Dネットワーク)の有効性を示し、事前訓練された2Dモデルの重量を活用し、分離された2Dまたは3D検出器と比較して精度が向上した。
しかし、スライスベースの2.5D検出器は、LNを3Dオブジェクトとしてスライス間一貫性を明示的にモデル化せず、最終的な3DLNインスタンスを生成するためにヒューリスティックな後統合ステップを必要とする。
本研究では,3次元LN検出をトラッキングタスクとして定式化し,新しいLN追跡トランスであるLN-Trackerを提案する。
DETRベースの検出器をベースとして、LN-Trackerはトランスフォーマーのクエリをトラックと検出グループに切り離し、トラッククエリはCTスキャンのz軸に沿ってトラックされたLNインスタンスを自動回帰的に追従する。
我々は、トラッククエリの内容を現在のスライスのコンテキストに合わせるために、マスク付きアテンションモジュールを備えた新しいトランスフォーマーデコーダを設計する一方で、現在のスライスにおける検出クエリの高精度な保存を行う。
スライス間の結合性LN結合を促進するために、スライス間類似性損失を導入する。
4つのリンパ節データセットの大規模な評価は、LN-Trackerの優れた性能を示し、他の上位3D/2.5D検出器と比較して、平均的な感度が2.7%向上している。
パブリック肺結節および前立腺腫瘍検出タスクのさらなる検証は、LN-Trackerが両方のタスクで最高のパフォーマンスを達成するため、一般化可能であることを確認する。
関連論文リスト
- DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - Effective Lymph Nodes Detection in CT Scans Using Location Debiased Query Selection and Contrastive Query Representation in Transformer [9.693078559346688]
我々はLN-DETRと呼ばれる新しいLN検出TRansformerを提案し、より正確な性能を実現する。
マルチスケール2.5D機能融合による2Dバックボーンの強化により,LNクエリの表現品質向上に大きく貢献する。
本手法は, 内部試験と外部試験の両方において, 同一のFPレートでの4-5%平均リコールにより, 先行手法の性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-04-04T22:31:15Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Minkowski Tracker: A Sparse Spatio-Temporal R-CNN for Joint Object
Detection and Tracking [53.64390261936975]
我々はオブジェクトの検出と追跡を共同で解決するスパース時間R-CNNであるMinkowski Trackerを提案する。
領域ベースCNN(R-CNN)に着想を得て,物体検出器R-CNNの第2段階として動きを追跡することを提案する。
大規模実験では,本手法の総合的な性能向上は4つの要因によることがわかった。
論文 参考訳(メタデータ) (2022-08-22T04:47:40Z) - Multi-Slice Dense-Sparse Learning for Efficient Liver and Tumor
Segmentation [4.150096314396549]
ディープ畳み込みニューラルネットワーク(DCNN)は2次元および3次元の医用画像セグメンテーションにおいて大きな成功を収めている。
そこで我々は,DCNNを正規化するための入力として,密接な隣接スライスと疎隣接スライスを抽出するデータの観点から,新しい密集スプリストレーニングフローを提案する。
また、ネットワークの観点から2.5Dの軽量nnU-Netを設計し、その効率を向上させるために深度的に分離可能な畳み込みを採用する。
論文 参考訳(メタデータ) (2021-08-15T15:29:48Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection [62.34374949726333]
擬似LiDAR(PL)は、LiDARセンサに基づく手法と安価なステレオカメラに基づく手法の精度ギャップを劇的に減らした。
PLは最先端のディープニューラルネットワークと2D深度マップ出力を3Dポイントクラウド入力に変換することで3Dオブジェクト検出のための3D深度推定を組み合わせている。
我々は、PLパイプライン全体をエンドツーエンドにトレーニングできるように、差別化可能なRepresentation (CoR)モジュールに基づく新しいフレームワークを導入します。
論文 参考訳(メタデータ) (2020-04-07T02:18:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。