論文の概要: UACANet: Uncertainty Augmented Context Attention for Polyp Semgnetaion
- arxiv url: http://arxiv.org/abs/2107.02368v1
- Date: Tue, 6 Jul 2021 03:11:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-07 13:48:28.591424
- Title: UACANet: Uncertainty Augmented Context Attention for Polyp Semgnetaion
- Title(参考訳): UACANet:polyp Semgnetaionに対する不確実性強化コンテキストアテンション
- Authors: Taehun Kim, Hyemin Lee, Daijin Kim
- Abstract要約: 我々は、追加のエンコーダとデコーダを備えたU-Net形状ネットワークの修正版を構築した。
各予測モジュールでは, 前景, 背景, 不確実領域マップの計算に, 予め予測した精度マップを利用する。
ETISデータセットの平均Diceは76.6%で、従来の最先端手法に比べて13.8%改善している。
- 参考スコア(独自算出の注目度): 12.089183640843416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose Uncertainty Augmented Context Attention network (UACANet) for
polyp segmentation which consider a uncertain area of the saliency map. We
construct a modified version of U-Net shape network with additional encoder and
decoder and compute a saliency map in each bottom-up stream prediction module
and propagate to the next prediction module. In each prediction module,
previously predicted saliency map is utilized to compute foreground, background
and uncertain area map and we aggregate the feature map with three area maps
for each representation. Then we compute the relation between each
representation and each pixel in the feature map. We conduct experiments on
five popular polyp segmentation benchmarks, Kvasir, CVC-ClinicDB, ETIS,
CVC-ColonDB and CVC-300, and achieve state-of-the-art performance. Especially,
we achieve 76.6% mean Dice on ETIS dataset which is 13.8% improvement compared
to the previous state-of-the-art method.
- Abstract(参考訳): 本研究では,サリエンシマップの不確実領域を考慮したポリプセグメンテーションのためのUncertainty Augmented Context Attention Network (UACANet)を提案する。
追加のエンコーダとデコーダを備えたu-netシェイプネットワークの修正版を構築し,各ボトムアップストリーム予測モジュールでサリエンシーマップを計算し,次の予測モジュールに伝播する。
各予測モジュールでは, 前景, 背景, 不確実領域マップの計算に先立って予測された精度マップを用い, 特徴マップを3つの領域マップで集約する。
次に,特徴写像における各表現と各画素の関係を計算する。
kvasir, cvc-clinicdb, etis, cvc-colondb, cvc-300の5つの人気のあるポリプセグメンテーションベンチマークを実験し, 最先端のパフォーマンスを実現する。
特に, ETISデータセットにおけるDiceの平均は76.6%であり, 従来の最先端手法に比べて13.8%改善されている。
関連論文リスト
- SATR: Zero-Shot Semantic Segmentation of 3D Shapes [74.08209893396271]
大規模オフザシェルフ2次元画像認識モデルを用いて3次元形状のゼロショットセマンティックセマンティックセマンティックセグメンテーションの課題について検討する。
本研究では、SATRアルゴリズムを開発し、ShapeNetPartと提案したFAUSTベンチマークを用いて評価する。
SATRは最先端のパフォーマンスを達成し、ベースラインアルゴリズムを平均mIoUの1.3%と4%で上回っている。
論文 参考訳(メタデータ) (2023-04-11T00:43:16Z) - Semantic Segmentation by Early Region Proxy [53.594035639400616]
本稿では,学習可能な領域のテッセルレーションとしてイメージを解釈することから始まる,新規で効率的なモデリングについて述べる。
領域のコンテキストをモデル化するために,Transformerを用いてシーケンス・ツー・シーケンス方式で領域を符号化する。
現在、符号化された領域埋め込みの上に、領域ごとのセマンティックセグメンテーションを行う。
論文 参考訳(メタデータ) (2022-03-26T10:48:32Z) - Improving Lidar-Based Semantic Segmentation of Top-View Grid Maps by
Learning Features in Complementary Representations [3.0413873719021995]
我々は、自律運転の文脈において、スパースで単発のLiDAR測定から意味情報を予測するための新しい方法を提案する。
このアプローチは、トップビューグリッドマップのセマンティックセグメンテーションを改善することを目的としている。
各表現に対して、セマンティック情報を効果的に抽出するために、調整されたディープラーニングアーキテクチャが開発された。
論文 参考訳(メタデータ) (2022-03-02T14:49:51Z) - ACDNet: Adaptively Combined Dilated Convolution for Monocular Panorama
Depth Estimation [9.670696363730329]
本研究では,単眼パノラマ画像の深度マップを予測するために,適応的に組み合わせた拡張畳み込みに基づくACDNetを提案する。
仮想および実世界の3つのデータセットで深度推定実験を行い,提案したACDNetが現在最先端(SOTA)手法を大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2021-12-29T08:04:19Z) - End-to-End Segmentation via Patch-wise Polygons Prediction [93.91375268580806]
先頭のセグメンテーション法は、出力マップをピクセルグリッドとして表現する。
画像パッチ毎に対象のエッジがモデル化される別の表現を、パッチごとのラベル確率と結合した$k$の頂点を持つポリゴンとして検討する。
論文 参考訳(メタデータ) (2021-12-05T10:42:40Z) - Dynamic Semantic Occupancy Mapping using 3D Scene Flow and Closed-Form
Bayesian Inference [3.0389083199673337]
深層学習を用いた最新技術セマンティックセマンティックセグメンテーションと3次元フロー推定を利用して,マップ推論の計測を行う。
連続的な(すなわち任意の解像度でクエリできる)ベイズモデルを開発し、フローでシーンを伝播し、静的なモデルよりも優れた性能で3次元意味的占有マップを推論する。
論文 参考訳(メタデータ) (2021-08-06T15:51:40Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - CPP-Net: Context-aware Polygon Proposal Network for Nucleus Segmentation [71.81734047345587]
核分割のためのコンテキストアウェアポリゴンプロポーザルネットワーク(CPP-Net)を提案する。
まず、距離予測のために各セル内の1つのピクセルではなく1つのポイントセットをサンプリングする。
次に,サンプリングされた点集合から予測を適応的に融合する信頼度に基づく重み付けモジュールを提案する。
第3に,予測された多角形形状を制約した新しい形状認識損失(sap)を提案する。
論文 参考訳(メタデータ) (2021-02-13T05:59:52Z) - TORNADO-Net: mulTiview tOtal vaRiatioN semAntic segmentation with
Diamond inceptiOn module [23.112192919085825]
TORNADO-Netは、3D LiDARポイントクラウドセマンティックセグメンテーションのためのニューラルネットワークである。
我々は、エンコーダデコーダResNetアーキテクチャを用いて、多視点(バードアイとレンジ)投影特徴抽出を組み込んだ。
また、LiDARデータは360度視野を包含し、円形のパディングを使用するという事実も活用する。
論文 参考訳(メタデータ) (2020-08-24T16:32:41Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。