論文の概要: How Can CNNs Use Image Position for Segmentation?
- arxiv url: http://arxiv.org/abs/2005.03463v1
- Date: Thu, 7 May 2020 13:38:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 00:01:07.929925
- Title: How Can CNNs Use Image Position for Segmentation?
- Title(参考訳): CNNはどのようにして画像位置をセグメンテーションに利用できるか?
- Authors: Rito Murase, Masanori Suganuma and Takayuki Okatani
- Abstract要約: 最近の研究では、CNNの畳み込み層に使用されるゼロパディングが、CNNに位置情報を提供することを示している。
しかし, 実験の設計には技術的問題があるため, クレームの正確性はまだ検証されていない。
- 参考スコア(独自算出の注目度): 23.98839374194848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolution is an equivariant operation, and image position does not affect
its result. A recent study shows that the zero-padding employed in
convolutional layers of CNNs provides position information to the CNNs. The
study further claims that the position information enables accurate inference
for several tasks, such as object recognition, segmentation, etc. However,
there is a technical issue with the design of the experiments of the study, and
thus the correctness of the claim is yet to be verified. Moreover, the absolute
image position may not be essential for the segmentation of natural images, in
which target objects will appear at any image position. In this study, we
investigate how positional information is and can be utilized for segmentation
tasks. Toward this end, we consider {\em positional encoding} (PE) that adds
channels embedding image position to the input images and compare PE with
several padding methods. Considering the above nature of natural images, we
choose medical image segmentation tasks, in which the absolute position appears
to be relatively important, as the same organs (of different patients) are
captured in similar sizes and positions. We draw a mixed conclusion from the
experimental results; the positional encoding certainly works in some cases,
but the absolute image position may not be so important for segmentation tasks
as we think.
- Abstract(参考訳): 畳み込みは同変演算であり、画像位置はその結果に影響を与えない。
最近の研究では、CNNの畳み込み層に使用されるゼロパディングが、CNNに位置情報を提供することを示している。
さらに,位置情報は,物体認識やセグメンテーションなど,複数のタスクに対して正確な推論を可能にする。
しかし, 実験の設計には技術的な問題があるため, 請求の正確性はまだ検証されていない。
さらに、対象オブジェクトが任意の画像位置に現れる自然画像のセグメンテーションには、絶対的な画像位置は必須ではないかもしれない。
本研究では,位置情報がどのようにしてセグメンテーションタスクに活用できるかを検討する。
この目的のために、入力画像に画像位置を埋め込んだチャネルを付加する PE ( {\em positional encoding}) について検討し、複数のパディング手法と比較する。
以上の自然画像の特徴を考慮すると、同一の臓器(異なる患者の臓器)が同じ大きさと位置で捕獲されるため、絶対的な位置が比較的重要であるように見える医療画像分割タスクを選択する。
位置エンコーディングは、いくつかのケースでは確実に機能するが、絶対像位置は、私たちが考えるようなセグメンテーションタスクでは重要ではないかもしれない。
関連論文リスト
- Effect of Rotation Angle in Self-Supervised Pre-training is Dataset-Dependent [3.434553688053531]
事前学習のための自己教師型学習は、ネットワークがより低レベルな機能を学ぶのに役立つ。
対照的に事前学習では、ネットワークは入力の異なるバージョンを区別するために事前訓練される。
対照的な事前学習を用いたトレーニングでは、$theta$とデータセットが興味深い方法で相互作用することを示す。
論文 参考訳(メタデータ) (2024-06-21T12:25:07Z) - Unsupervised Domain Adaptation for Medical Image Segmentation via
Feature-space Density Matching [0.0]
本稿ではセマンティックセグメンテーションのための教師なしドメイン適応手法を提案する。
対象データ分布を特徴空間のソースとマッチングする。
提案手法の有効性を2つのデータセット,多部位前立腺MRI,病理組織像に示す。
論文 参考訳(メタデータ) (2023-05-09T22:24:46Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Residual Moment Loss for Medical Image Segmentation [56.72261489147506]
位置情報は,対象物体の多様体構造を捉えた深層学習モデルに有効であることが証明された。
既存のほとんどの手法は、ネットワークが学習するために、位置情報を暗黙的にエンコードする。
セグメント化対象の位置情報を明示的に埋め込むために,新しい損失関数,すなわち残差モーメント(RM)損失を提案する。
論文 参考訳(メタデータ) (2021-06-27T09:31:49Z) - Compositional Sketch Search [91.84489055347585]
フリーハンドスケッチを用いて画像コレクションを検索するアルゴリズムを提案する。
シーン構成全体を特定するための簡潔で直感的な表現として描画を利用する。
論文 参考訳(メタデータ) (2021-06-15T09:38:09Z) - Duplex Contextual Relation Network for Polyp Segmentation [19.509290186267396]
画像内および画像間コンテキスト間関係をキャプチャする二重文脈関係ネットワーク(dcrnet)を提案する。
提案手法をEndoScene, Kvasir-SEG, 最近リリースされた大規模PICCOLOデータセット上で評価した。
論文 参考訳(メタデータ) (2021-03-11T15:19:54Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - Position, Padding and Predictions: A Deeper Look at Position Information
in CNNs [30.583407443282365]
一般に使われているCNNでは、絶対位置情報の驚くほどの情報が符号化されていることを示す。
ゼロパディングはCNNに内部表現の位置情報を符号化させるが、パディングの欠如は位置符号化を妨げていることを示す。
これにより、CNNにおける位置情報の役割に関するより深い疑問がもたらされる。
論文 参考訳(メタデータ) (2021-01-28T23:40:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。