Fugu-MT 論文翻訳(概要): RadioActive: 3D Radiological Interactive Segmentation Benchmark

論文の概要: RadioActive: 3D Radiological Interactive Segmentation Benchmark

arxiv url: http://arxiv.org/abs/2411.07885v2
Date: Fri, 29 Nov 2024 09:02:25 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 20:28:07.493255
Title: RadioActive: 3D Radiological Interactive Segmentation Benchmark
Title（参考訳）: RadioActive: 放射線学的インタラクティブセグメンテーションベンチマーク
Authors: Constantin Ulrich, Tassilo Wald, Emily Tempus, Maximilian Rokuss, Paul F. Jaeger, Klaus Maier-Hein,
Abstract要約: 臨床シナリオにおける対話的セグメンテーション手法を評価するために,RadioActiveベンチマークを導入する。多様なデータセット、ターゲット構造、インタラクティブなセグメンテーションメソッドを含む。ドメインギャップにもかかわらず、スライス的に誘導されるアプローチのパフォーマンスがネイティブな3Dメソッドと一致できることが、驚くほど示されている。
参考スコア（独自算出の注目度）: 1.1095764130645482
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Current interactive segmentation approaches, inspired by the success of META's Segment Anything model, have achieved notable advancements, however, they come with substantial limitations that hinder their practical application in 3D radiological scenarios. These include unrealistic human interaction requirements, such as slice-by-slice operations for 2D models on 3D data, a lack of iterative interactive refinement, and insufficient evaluation experiments. These shortcomings prevent accurate assessment of model performance and lead to inconsistent outcomes across studies. The RadioActive benchmark overcomes these challenges by offering a comprehensive and reproducible evaluation of interactive segmentation methods in realistic, clinically relevant scenarios. It includes diverse datasets, target structures, and interactive segmentation methods, and provides a flexible, extendable codebase that allows seamless integration of new models and prompting strategies. We also introduce advanced prompting techniques to enable 2D models on 3D data by reducing the needed number of interaction steps, enabling a fair comparison. We show that surprisingly the performance of slice-wise prompted approaches can match native 3D methods, despite the domain gap. Our findings challenge the current literature and highlight that models not specifically trained on medical data can outperform the current specialized medical methods. By open-sourcing RadioActive, we invite the research community to integrate their models and prompting techniques, ensuring continuous and transparent evaluation of interactive segmentation models in 3D medical imaging.
Abstract（参考訳）: 現在の対話的セグメンテーションアプローチは、METAのセグメンション・アプライシング・モデルの成功にインスパイアされたものであり、顕著な進歩を遂げているが、3Dラジオグラフィーのシナリオにおける実践的応用を妨げる重大な制限が伴っている。例えば、3Dデータ上の2次元モデルのスライス・バイ・スライス・オペレーション、反復的インタラクティブ・リファインメントの欠如、評価実験の不十分などである。これらの欠点は、モデル性能の正確な評価を妨げ、研究全体で矛盾した結果をもたらす。 RadioActiveベンチマークは、リアルで臨床的に関係のあるシナリオにおいて、インタラクティブなセグメンテーション手法の包括的で再現可能な評価を提供することによって、これらの課題を克服する。多様なデータセット、ターゲット構造、インタラクティブなセグメンテーションメソッドが含まれており、フレキシブルで拡張可能なコードベースを提供し、新しいモデルのシームレスな統合と戦略の推進を可能にしている。また、3次元データ上で2次元モデルを実現するための高度なプロンプト技術を導入し、必要な対話ステップ数を削減し、公正な比較を可能にする。ドメインギャップにもかかわらず、スライス的に誘導されるアプローチのパフォーマンスがネイティブな3Dメソッドと一致できることが、驚くほど示されている。以上の結果から,医療データに特化していないモデルは,現在の専門的な医療手法よりも優れていることが示唆された。 RadioActiveをオープンソース化することで、研究コミュニティに彼らのモデルの統合と技術推進、インタラクティブなセグメンテーションモデルの3D医療画像の連続的かつ透過的な評価を依頼する。

関連論文リスト

ReCoGNet: Recurrent Context-Guided Network for 3D MRI Prostate Segmentation [11.248082139905865]
アノテーション付きデータとしてMRIシーケンスをモデル化するハイブリッドアーキテクチャを提案する。本手法では, 深層保存型DeepVLab3バックボーンを用いて, それぞれのMRIスライスから高レベルなセマンティック特徴を抽出し, コンブLSTM層で構築した再帰的畳み込みヘッドを用いて, スライス間の情報統合を行う。現状の2D, 3Dセグメンテーションモデルと比較して, 精度, リコール, IoU, Dice similarity Coefficient (DSC) およびロバストネスの点で優れた性能を示す。
論文参考訳（メタデータ） (2025-06-24T14:56:55Z)
nnInteractive: Redefining 3D Promptable Segmentation [0.461929066711062]
我々は,最初の包括的3次元対話型オープンセットセグメンテーション手法であるnnInteractiveを紹介する。多様なプロンプト、スクリブル、ボックス、そして、直感的な2Dインタラクションを活用して完全な3Dセグメンテーションを生成する新しいラッソのプロンプトをサポートする。 nnInteractiveは、正確性、適応性、ユーザビリティの新たな最先端を設定できる。
論文参考訳（メタデータ） (2025-03-11T12:30:34Z)
MG-3D: Multi-Grained Knowledge-Enhanced 3D Medical Vision-Language Pre-training [7.968487067774351]
3次元医用画像解析は多くの臨床応用において重要である。 3次元医用画像解析では、大規模視覚言語による事前訓練がまだ検討されていない。大規模データ(47.1K)に基づいて事前学習したMG-3Dを提案する。
論文参考訳（メタデータ） (2024-12-08T09:45:59Z)
Cross-D Conv: Cross-Dimensional Transferable Knowledge Base via Fourier Shifting Operation [3.69758875412828]
クロスD Conv 演算はフーリエ領域における位相シフトを学習することで次元ギャップを橋渡しする。本手法は2次元と3次元の畳み込み操作間のシームレスな重み移動を可能にする。
論文参考訳（メタデータ） (2024-11-02T13:03:44Z)
3D-CT-GPT: Generating 3D Radiology Reports through Integration of Large Vision-Language Models [51.855377054763345]
本稿では,VQAに基づく医用視覚言語モデルである3D-CT-GPTについて紹介する。パブリックデータセットとプライベートデータセットの両方の実験により、3D-CT-GPTはレポートの正確さと品質という点で既存の手法を著しく上回っていることが示された。
論文参考訳（メタデータ） (2024-09-28T12:31:07Z)
Enhanced segmentation of femoral bone metastasis in CT scans of patients using synthetic data generation with 3D diffusion models [0.06700983301090582]
本稿では,3次元拡散確率モデル(DDPM)を用いた自動データパイプラインを提案する。 5675巻を新たに作成し,実データと合成データに基づいて3次元U-Netセグメンテーションモデルを訓練し,セグメンテーション性能を比較した。
論文参考訳（メタデータ） (2024-09-17T09:21:19Z)
Towards Synergistic Deep Learning Models for Volumetric Cirrhotic Liver Segmentation in MRIs [1.5228650878164722]
世界的死亡の主な原因である肝硬変は、効果的な疾患モニタリングと治療計画のためにROIを正確に区分する必要がある。既存のセグメンテーションモデルは、複雑な機能インタラクションをキャプチャして、さまざまなデータセットをまたいだ一般化に失敗することが多い。本稿では、補間潜在空間を拡張的特徴相互作用モデリングに活用する新しい相乗論的理論を提案する。
論文参考訳（メタデータ） (2024-08-08T14:41:32Z)
Monocular pose estimation of articulated surgical instruments in open surgery [0.873811641236639]
本研究は,開腹手術における手術器具の単眼6Dポーズ推定への新たなアプローチとして,物体調音,対称性,注釈付き実世界のデータの欠如といった課題に対処する。提案手法は,(1)手術器具の3次元モデリングと調音リギングを用いた合成データ生成,(2)ポーズ推定とハイブリッドな幾何学的融合戦略を組み合わせたポーズ推定フレームワーク,(3)自動生成擬似ラベルを用いた実ビデオデータへのドメイン適応を用いた,合成データと実際の注釈データの両方を利用したトレーニング戦略,の3つの構成要素から構成される。
論文参考訳（メタデータ） (2024-07-16T19:47:35Z)
Composable Interventions for Language Models [60.32695044723103]
言語モデルのテストタイム介入は、事実の正確性を高め、有害な出力を軽減し、コストのかかる再トレーニングなしにモデルの効率を向上させる。しかし、新しい手法の洪水にもかかわらず、様々な種類の介入が独立して発展している。複数の介入が同じ言語モデルに与える影響を研究するためのフレームワークである構成可能な介入を導入する。
論文参考訳（メタデータ） (2024-07-09T01:17:44Z)
Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation [66.3814684757376]
本研究は,RGB 6Dのカテゴリレベルでのポーズ推定を向上するための拡散モデルに基づく新規ビュー合成器の実用性を示す最初の研究であるZero123-6Dを示す。本手法は,データ要求の低減,ゼロショットカテゴリレベルの6Dポーズ推定タスクにおける深度情報の必要性の除去,およびCO3Dデータセットの実験により定量的に示された性能の向上を示す。
論文参考訳（メタデータ） (2024-03-21T10:38:18Z)
Self-supervised 3D Patient Modeling with Multi-modal Attentive Fusion [32.71972792352939]
3次元患者体モデリングは、スマート・メディカル・スキャンおよび手術室における患者の自動位置決めの成功に不可欠である。既存のCNNベースのエンドツーエンドの患者モデリングソリューションは、通常、大量の関連するトレーニングデータを必要とするカスタマイズされたネットワーク設計を必要とする。 a) 2次元関節局所化のための注意融合を伴うマルチモーダルキーポイント検出モジュールからなる汎用的なモジュール化された3次元患者モデリング手法を提案する。本手法の有効性を,公用および臨床用両方のデータを用いた広範囲な患者位置決め実験により実証した。
論文参考訳（メタデータ） (2024-03-05T18:58:55Z)
Enhancing Weakly Supervised 3D Medical Image Segmentation through Probabilistic-aware Learning [52.249748801637196]
3次元医用画像のセグメンテーションは、疾患の診断と治療計画に重要な意味を持つ課題である。近年の深層学習の進歩は、完全に教師付き医療画像のセグメンテーションを著しく強化している。本稿では,3次元医用画像に特化して設計された,確率的適応型弱教師付き学習パイプラインを提案する。
論文参考訳（メタデータ） (2024-03-05T00:46:53Z)
S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠であるこれまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-22T11:40:49Z)
DatasetNeRF: Efficient 3D-aware Data Factory with Generative Radiance Fields [68.94868475824575]
本稿では,無限で高品質な3Dアノテーションを3Dポイントクラウドセグメンテーションとともに生成できる新しいアプローチを提案する。我々は3次元生成モデルに先立って強力なセマンティクスを活用してセマンティクスデコーダを訓練する。トレーニングが完了すると、デコーダは遅延空間を効率よく一般化し、無限のデータの生成を可能にする。
論文参考訳（メタデータ） (2023-11-18T21:58:28Z)
SynergyNet: Bridging the Gap between Discrete and Continuous Representations for Precise Medical Image Segmentation [4.562266115935329]
既存のエンコーダ/デコーダセグメンテーションフレームワークを強化するために設計された新しいボトルネックアーキテクチャであるSynergyNetを提案する。マルチオーガナイズドセグメンテーションと心的データセットを用いた実験により,SynergyNetが他の技術手法よりも優れていることが示された。我々の革新的なアプローチは、医用画像解析の重要な領域において、ディープラーニングモデルの全体的な性能と能力を高める方法である。
論文参考訳（メタデータ） (2023-10-26T20:13:44Z)
Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文参考訳（メタデータ） (2022-07-17T07:05:39Z)
Extending Process Discovery with Model Complexity Optimization and Cyclic States Identification: Application to Healthcare Processes [62.997667081978825]
モデル最適化のための半自動支援を実現するプロセスマイニング手法を提案する。所望の粒度で生モデルを抽象化するモデル単純化手法が提案されている。医療分野の異なるアプリケーションから得られた3つのデータセットを用いて、技術的ソリューションの能力を実証することを目的としている。
論文参考訳（メタデータ） (2022-06-10T16:20:59Z)
LocATe: End-to-end Localization of Actions in 3D with Transformers [91.28982770522329]
LocATeは、3Dシーケンスでアクションを共同でローカライズし認識するエンドツーエンドのアプローチである。画像やパッチの特徴を入力として考えるトランスフォーマーベースのオブジェクト検出や分類モデルとは異なり、LocATeのトランスフォーマーモデルはシーケンス内のアクション間の長期的な相関をキャプチャすることができる。 BABEL-TAL-20 (BT20) という新しい,挑戦的で,より現実的なベンチマークデータセットを導入する。
論文参考訳（メタデータ） (2022-03-21T03:35:32Z)
Bidirectional RNN-based Few Shot Learning for 3D Medical Image Segmentation [11.873435088539459]
対象臓器アノテーションの限られたトレーニングサンプルを用いて, 正確な臓器分類を行うための3次元ショットセグメンテーションフレームワークを提案する。 U-Netのようなネットワークは、サポートデータの2次元スライスとクエリイメージの関係を学習することでセグメンテーションを予測するように設計されている。異なる臓器のアノテーションを付加した3つの3次元CTデータセットを用いて,提案モデルの評価を行った。
論文参考訳（メタデータ） (2020-11-19T01:44:55Z)
Volumetric Medical Image Segmentation: A 3D Deep Coarse-to-fine Framework and Its Adversarial Examples [74.92488215859991]
本稿では,これらの課題に効果的に取り組むために,新しい3Dベースの粗粒度フレームワークを提案する。提案した3Dベースのフレームワークは、3つの軸すべてに沿ってリッチな空間情報を活用できるため、2Dよりも大きなマージンで優れている。我々は,3つのデータセット,NIH膵データセット,JHMI膵データセット,JHMI病理嚢胞データセットについて実験を行った。
論文参考訳（メタデータ） (2020-10-29T15:39:19Z)
Robust Medical Instrument Segmentation Challenge 2019 [56.148440125599905]
腹腔鏡装置の術中追跡は、しばしばコンピュータとロボットによる介入の必要条件である。本研究の課題は,30の手術症例から取得した10,040枚の注釈画像からなる外科的データセットに基づいていた。結果は、初期仮説、すなわち、アルゴリズムの性能がドメインギャップの増大とともに低下することを確認する。
論文参考訳（メタデータ） (2020-03-23T14:35:08Z)
Estimating the Effects of Continuous-valued Interventions using Generative Adversarial Networks [103.14809802212535]
我々は,連続的評価介入の効果を推定する問題に対処するため,GAN(Generative Adversarial Network)フレームワークを構築した。我々のモデルであるSCIGANは柔軟であり、いくつかの異なる継続的な介入に対する対実的な結果の同時推定が可能である。継続的な介入に移行することによって生じる課題に対処するために、差別者のための新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (2020-02-27T18:46:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。