論文の概要: Duplex Contextual Relation Network for Polyp Segmentation
- arxiv url: http://arxiv.org/abs/2103.06725v1
- Date: Thu, 11 Mar 2021 15:19:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-12 14:43:54.028816
- Title: Duplex Contextual Relation Network for Polyp Segmentation
- Title(参考訳): ポリップセグメンテーションのための二重文脈関係ネットワーク
- Authors: Zijin Yin, Kongming Liang, Zhanyu Ma, Jun Guo
- Abstract要約: 画像内および画像間コンテキスト間関係をキャプチャする二重文脈関係ネットワーク(dcrnet)を提案する。
提案手法をEndoScene, Kvasir-SEG, 最近リリースされた大規模PICCOLOデータセット上で評価した。
- 参考スコア(独自算出の注目度): 19.509290186267396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Polyp segmentation is of great importance in the early diagnosis and
treatment of colorectal cancer. Since polyps vary in their shape, size, color,
and texture, accurate polyp segmentation is very challenging. One promising way
to mitigate the diversity of polyps is to model the contextual relation for
each pixel such as using attention mechanism. However, previous methods only
focus on learning the dependencies between the position within an individual
image and ignore the contextual relation across different images. In this
paper, we propose Duplex Contextual Relation Network (DCRNet) to capture both
within-image and cross-image contextual relations. Specifically, we first
design Interior Contextual-Relation Module to estimate the similarity between
each position and all the positions within the same image. Then Exterior
Contextual-Relation Module is incorporated to estimate the similarity between
each position and the positions across different images. Based on the above two
types of similarity, the feature at one position can be further enhanced by the
contextual region embedding within and across images. To store the
characteristic region embedding from all the images, a memory bank is designed
and operates as a queue. Therefore, the proposed method can relate similar
features even though they come from different images. We evaluate the proposed
method on the EndoScene, Kvasir-SEG and the recently released large-scale
PICCOLO dataset. Experimental results show that the proposed DCRNet outperforms
the state-of-the-art methods in terms of the widely-used evaluation metrics.
- Abstract(参考訳): ポリープ分画は早期大腸癌の診断と治療において極めて重要である。
ポリプの形状、サイズ、色、テクスチャは様々であるため、正確なポリプのセグメンテーションは非常に難しい。
ポリプの多様性を緩和する1つの有望な方法は、アテンション機構などの各ピクセルのコンテキスト関係をモデル化することである。
しかし、従来の手法では、個々の画像内の位置間の依存関係を学習することのみに集中し、異なる画像間のコンテキスト関係を無視する。
本稿では,画像内のコンテキスト関係と画像間のコンテキスト関係の両方をキャプチャする二重文脈関係ネットワーク(dcrnet)を提案する。
具体的には、まず内部文脈関係モジュールを設計し、各位置と同一画像内のすべての位置との類似性を推定する。
次に、外部の文脈関連モジュールを組み込んで、異なる画像間の各位置と位置の類似度を推定する。
上記の2種類の類似性に基づき、画像内および画像間のコンテキスト領域埋め込みにより、1つの位置における特徴をさらに強化することができる。
すべての画像から埋め込まれた特徴領域を保存するため、メモリバンクはキューとして設計・運用される。
そこで,提案手法では,異なる画像からでも類似した特徴を関連付けることができる。
提案手法をEndoScene, Kvasir-SEG, 最近リリースされた大規模PICCOLOデータセット上で評価した。
実験の結果,提案したDCRNetは,広く利用されている評価指標で最先端の手法よりも優れていた。
関連論文リスト
- Language Guided Domain Generalized Medical Image Segmentation [68.93124785575739]
単一ソースドメインの一般化は、より信頼性が高く一貫性のあるイメージセグメンテーションを現実の臨床環境にわたって約束する。
本稿では,テキストエンコーダ機能によって案内されるコントラスト学習機構を組み込むことで,テキスト情報を明確に活用する手法を提案する。
文献における既存手法に対して,本手法は良好な性能を発揮する。
論文 参考訳(メタデータ) (2024-04-01T17:48:15Z) - CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition [73.51329037954866]
視覚的位置認識のための画像間相関認識を用いたロバストなグローバル表現手法を提案する。
本手法では,バッチ内の複数の画像の相関にアテンション機構を用いる。
本手法は,訓練時間を大幅に短縮し,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-29T15:05:11Z) - Discriminative Co-Saliency and Background Mining Transformer for
Co-Salient Object Detection [111.04994415248736]
我々は差別的共存とバックグラウンドマイニング・トランスフォーマー・フレームワーク(DMT)を提案する。
我々は2種類の事前定義されたトークンを用いて、コントラスト誘起画素間相関モジュールとコサリエンストークン間相関モジュールを用いて、コサリエンシと背景情報をマイニングする。
3つのベンチマークデータセットの実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-04-30T15:56:47Z) - Explicit Correspondence Matching for Generalizable Neural Radiance
Fields [49.49773108695526]
本稿では,新たな未知のシナリオに一般化し,2つのソースビューで新規なビュー合成を行う新しいNeRF手法を提案する。
明瞭な対応マッチングは、異なるビュー上の3Dポイントの2次元投影でサンプリングされた画像特徴間のコサイン類似度と定量化される。
実験では,実験結果から得られたコサイン特徴の類似性と体積密度との間に強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-04-24T17:46:01Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Exploring Cross-Image Pixel Contrast for Semantic Segmentation [130.22216825377618]
完全教師付きセッティングにおけるセマンティックセグメンテーションのための画素単位のコントラストフレームワークを提案する。
中心となる考え方は、同じセマンティッククラスに属するピクセルの埋め込みを、異なるクラスの埋め込みよりもよく似ているように強制することである。
テスト中に余分なオーバーヘッドを伴わずに既存のセグメンテーションフレームワークに懸命に組み込むことができる。
論文 参考訳(メタデータ) (2021-01-28T11:35:32Z) - Gigapixel Histopathological Image Analysis using Attention-based Neural
Networks [7.1715252990097325]
圧縮経路と学習経路からなるCNN構造を提案する。
本手法は,グローバル情報とローカル情報の両方を統合し,入力画像のサイズに関して柔軟であり,弱い画像レベルラベルのみを必要とする。
論文 参考訳(メタデータ) (2021-01-25T10:18:52Z) - Domain Siamese CNNs for Sparse Multispectral Disparity Estimation [15.065764374430783]
そこで本研究では,異なるスペクトルの画像間の不均一性を推定できる新しいCNNアーキテクチャを提案する。
LITIV 2014およびLITIV 2018データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2020-04-30T20:29:59Z) - Image Quality Assessment: Unifying Structure and Texture Similarity [38.05659069533254]
テクスチャリサンプリングに対する耐性を明示した,最初のフル参照画像品質モデルを開発した。
畳み込みニューラルネットワークを用いて、画像をオーバーコンプリート表現に変換するインジェクティブで微分可能な関数を構築する。
論文 参考訳(メタデータ) (2020-04-16T16:11:46Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。