論文の概要: Guiding the Guidance: A Comparative Analysis of User Guidance Signals
for Interactive Segmentation of Volumetric Images
- arxiv url: http://arxiv.org/abs/2303.06942v1
- Date: Mon, 13 Mar 2023 09:17:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 15:56:30.872465
- Title: Guiding the Guidance: A Comparative Analysis of User Guidance Signals
for Interactive Segmentation of Volumetric Images
- Title(参考訳): 指導の指導 : ボリューム画像のインタラクティブセグメンテーションのためのユーザ誘導信号の比較分析
- Authors: Zdravko Marinov, Rainer Stiefelhagen, Jens Kleesiek
- Abstract要約: モデル設計における重要なパラメータを特定するために,既存のガイダンス信号の比較研究を行う。
本稿では,ジオデシック距離変換を用いたガウス熱マップ誘導信号を提案し,クリックの符号化時に各ヒートマップの半径を動的に適応させる。
これらの結果から,対話型セグメンテーションでは誘導信号の選択が不可欠であることが示唆された。
- 参考スコア(独自算出の注目度): 23.34168469435991
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive segmentation reduces the annotation time of medical images and
allows annotators to iteratively refine labels with corrective interactions,
such as clicks. While existing interactive models transform clicks into user
guidance signals, which are combined with images to form (image, guidance)
pairs, the question of how to best represent the guidance has not been fully
explored. To address this, we conduct a comparative study of existing guidance
signals by training interactive models with different signals and parameter
settings to identify crucial parameters for the model's design. Based on our
findings, we design a guidance signal that retains the benefits of other
signals while addressing their limitations. We propose an adaptive Gaussian
heatmaps guidance signal that utilizes the geodesic distance transform to
dynamically adapt the radius of each heatmap when encoding clicks. We conduct
our study on the MSD Spleen and the AutoPET datasets to explore the
segmentation of both anatomy (spleen) and pathology (tumor lesions). Our
results show that choosing the guidance signal is crucial for interactive
segmentation as we improve the performance by 14% Dice with our adaptive
heatmaps on the challenging AutoPET dataset when compared to non-interactive
models. This brings interactive models one step closer to deployment on
clinical workflows. We will make our code publically available.
- Abstract(参考訳): インタラクティブなセグメンテーションは、医用画像のアノテーション時間を短縮し、クリックのような修正的な相互作用でラベルを反復的に洗練することができる。
既存のインタラクティブなモデルでは、クリックをユーザー誘導信号に変換し、画像と組み合わせて(画像、ガイダンス)ペアを形成するが、ガイダンスの最適な表現方法に関する問題は十分に検討されていない。
そこで本研究では,モデル設計における重要なパラメータを特定するために,異なる信号とパラメータ設定を持つ対話型モデルを訓練することにより,既存のガイダンス信号の比較研究を行う。
本研究は,その限界に対処しながら,他の信号の利点を維持する誘導信号の設計を行った。
本稿では,ジオデシック距離変換を用いたガウス熱マップ誘導信号を提案し,クリックの符号化時に各ヒートマップの半径を動的に適応させる。
我々は,MSD脾臓とAutoPETデータセットについて,解剖学的(脾)と病理的(腫瘍病変)のセグメンテーションについて検討した。
その結果,対話型セグメンテーションでは誘導信号の選択が重要であり,非対話型モデルと比較した場合,適応型ヒートマップを用いて14%Diceで性能を向上することが示唆された。
これにより、インタラクティブなモデルが、臨床ワークフローへのデプロイに一歩近づいた。
コードを公開して公開します。
関連論文リスト
- Sensitivity-Informed Augmentation for Robust Segmentation [21.609070498399863]
カメラ品質の変動やレンズ歪みなどの内部ノイズはセグメンテーションモデルの性能に影響を与える可能性がある。
我々は,学習ベースセグメンテーションモデルの堅牢性を高めるために,効率的で適応性があり,勾配のない手法を提案する。
論文 参考訳(メタデータ) (2024-06-03T15:25:45Z) - Mapping EEG Signals to Visual Stimuli: A Deep Learning Approach to Match
vs. Mismatch Classification [28.186129896907694]
ビデオクリップが脳波信号の興奮応答を誘導するかどうかを分類する「マッチ-vs-mismatch」深層学習モデルを提案する。
提案手法は, 未知の被写体に対して最も精度の高いモデルを実現することができることを示す。
これらの結果は、ニューラル記録に基づくビデオ再構成の開発を促進する可能性がある。
論文 参考訳(メタデータ) (2023-09-08T06:37:25Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Skeleton-based Action Recognition through Contrasting Two-Stream
Spatial-Temporal Networks [11.66009967197084]
本稿では,空間的および時間的モジュールを並列に融合するContrastive GCN-Transformer Network(ConGT)を提案する。
我々は3つのベンチマークデータセットで実験を行い、このモデルが動作認識における最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2023-01-27T02:12:08Z) - Complete Cross-triplet Loss in Label Space for Audio-visual Cross-modal
Retrieval [7.459223771397159]
クロスモーダルデータ(例えばオーディオヴィジュアル)は直接比較できない分布と表現が異なる。
オーディオ・ヴィジュアルデータの自然な同期における内在的相関をアノテートされたラベルの助けを借りることで、オーディオ・ヴィジュアル・モダリティ間のギャップを埋めるため、それらの共通部分空間を学習する。
ラベルを直接予測して意味的特徴を最適化する新しいAV-CMRモデルを提案する。
論文 参考訳(メタデータ) (2022-11-07T10:37:14Z) - Hybrid Routing Transformer for Zero-Shot Learning [83.64532548391]
本稿ではハイブリッド・ルーティング・トランス (HRT) と呼ばれる新しいトランス・デコーダモデルを提案する。
ボトムアップとトップダウンの動的ルーティング経路の両方で構築されたアクティブアテンションを組み込んで,属性に整合した視覚的特徴を生成する。
HRTデコーダでは,属性対応の視覚特徴,対応する属性セマンティクス,およびクラス属性ベクトル間の相関関係を静的なルーティングで計算し,最終クラスラベルの予測を生成する。
論文 参考訳(メタデータ) (2022-03-29T07:55:08Z) - HighlightMe: Detecting Highlights from Human-Centric Videos [52.84233165201391]
我々は,人間中心のビデオからハイライト可能な抜粋を検出するために,ドメインとユーザに依存しないアプローチを提案する。
本研究では,時空間グラフ畳み込みを用いたオートエンコーダネットワークを用いて,人間の活動やインタラクションを検出する。
我々は,最先端の手法に比べて,人手によるハイライトのマッチングの平均精度が4~12%向上したことを観察した。
論文 参考訳(メタデータ) (2021-10-05T01:18:15Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - A Graph-based Interactive Reasoning for Human-Object Interaction
Detection [71.50535113279551]
本稿では,HOIを推論するインタラクティブグラフ(Interactive Graph, in-Graph)という,グラフに基づくインタラクティブ推論モデルを提案する。
In-GraphNet と呼ばれる HOI を検出するための新しいフレームワークを構築した。
私たちのフレームワークはエンドツーエンドのトレーニングが可能で、人間のポーズのような高価なアノテーションはありません。
論文 参考訳(メタデータ) (2020-07-14T09:29:03Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。