論文の概要: Context-aware Padding for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2109.07854v1
- Date: Thu, 16 Sep 2021 10:33:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-17 13:57:53.078420
- Title: Context-aware Padding for Semantic Segmentation
- Title(参考訳): 意味セグメンテーションのための文脈認識パディング
- Authors: Yu-Hui Huang, Marc Proesmans, Luc Van Gool
- Abstract要約: 画像の拡張のためのコンテキスト認識(CA)パディング手法を提案する。
ResNetベースのセグメンテーションモデルでは、コンテキスト認識パディングを用いることで、従来のゼロパディングよりも高い平均断面積を達成できる。
- 参考スコア(独自算出の注目度): 82.37483350347559
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero padding is widely used in convolutional neural networks to prevent the
size of feature maps diminishing too fast. However, it has been claimed to
disturb the statistics at the border. As an alternative, we propose a
context-aware (CA) padding approach to extend the image. We reformulate the
padding problem as an image extrapolation problem and illustrate the effects on
the semantic segmentation task. Using context-aware padding, the ResNet-based
segmentation model achieves higher mean Intersection-Over-Union than the
traditional zero padding on the Cityscapes and the dataset of DeepGlobe
satellite imaging challenge. Furthermore, our padding does not bring noticeable
overhead during training and testing.
- Abstract(参考訳): ゼロパディングは畳み込みニューラルネットワークにおいて、特徴マップのサイズが速すぎないように広く使われている。
しかし、国境の統計を妨害していると主張されている。
代替として、画像を拡張するためのコンテキスト認識(CA)パディング手法を提案する。
画像外挿問題としてパディング問題を再構成し,意味的セグメンテーションタスクに与える影響を解説する。
resnetベースのセグメンテーションモデルは、コンテキストアウェアパディングを使用して、従来の都市景観のゼロパディングやdeepglobe衛星画像チャレンジのデータセットよりも高い平均交点オーバー結合を達成する。
さらに、私たちのパディングは、トレーニングやテスト中に目立ったオーバーヘッドをもたらしません。
関連論文リスト
- Associative Memories in the Feature Space [68.1903319310263]
本稿では,低次元のセマンティック埋め込みのみを記憶するメモリモデルを提案する。
MNISTデータセット上の単純なタスクに対して,本手法の概念実証を行う。
論文 参考訳(メタデータ) (2024-02-16T16:37:48Z) - PadChannel: Improving CNN Performance through Explicit Padding Encoding [40.39759037668144]
畳み込みニューラルネットワーク(CNN)では、パディングは層全体の空間的次元を保存する上で重要な役割を果たす。
従来のパディング技術は、実際の画像内容とパッド領域を明確に区別するものではない。
本研究では,パディングステータスを付加的な入力チャネルとしてエンコードする新しいパディング手法PadChannelを提案する。
論文 参考訳(メタデータ) (2023-11-13T07:44:56Z) - Learning Semantic Segmentation with Query Points Supervision on Aerial Images [57.09251327650334]
セマンティックセグメンテーションアルゴリズムを学習するための弱教師付き学習アルゴリズムを提案する。
提案手法は正確なセマンティックセグメンテーションを行い,手作業のアノテーションに要するコストと時間を大幅に削減することで効率を向上する。
論文 参考訳(メタデータ) (2023-09-11T14:32:04Z) - On the Interplay of Convolutional Padding and Adversarial Robustness [16.306183236605364]
本研究は, 対人攻撃によって画像境界における摂動異常が生じることを示し, 対人攻撃はパディングが用いられる領域であることを示した。
異なるパディングモード(またはその欠如)が様々なシナリオにおける敵の堅牢性にどのように影響するかという質問に対する回答を求める。
論文 参考訳(メタデータ) (2023-08-12T17:06:48Z) - Localizing Semantic Patches for Accelerating Image Classification [12.250230630124758]
まず、AnchorNetと呼ばれる軽量パッチ提案ネットワークを用いて、入力画像上のタスク認識領域をピンポイントする。
次に、より小さな空間冗長性を持つ局所的なセマンティックパッチを一般的な分類ネットワークに供給する。
提案手法は,より少ない推論コストでSOTA動的推論手法より優れる。
論文 参考訳(メタデータ) (2022-06-07T15:01:54Z) - Background-Aware Pooling and Noise-Aware Loss for Weakly-Supervised
Semantic Segmentation [27.50216933606052]
バウンディングボックスアノテーションを用いた弱い教師付きセマンティックセグメンテーションの問題に対処する。
背景領域は画像内の一部で知覚的に一貫性があり、オブジェクト境界ボックス内の前景と背景領域を識別するために利用することができる。
ノイズ認識損失(nal)により,誤りラベルに対するネットワークの感受性が低下する。
論文 参考訳(メタデータ) (2021-04-02T06:38:41Z) - Exploring Cross-Image Pixel Contrast for Semantic Segmentation [130.22216825377618]
完全教師付きセッティングにおけるセマンティックセグメンテーションのための画素単位のコントラストフレームワークを提案する。
中心となる考え方は、同じセマンティッククラスに属するピクセルの埋め込みを、異なるクラスの埋め込みよりもよく似ているように強制することである。
テスト中に余分なオーバーヘッドを伴わずに既存のセグメンテーションフレームワークに懸命に組み込むことができる。
論文 参考訳(メタデータ) (2021-01-28T11:35:32Z) - An Empirical Method to Quantify the Peripheral Performance Degradation
in Deep Networks [18.808132632482103]
畳み込みニューラルネットワーク(CNN)カーネルは、各畳み込み層に結合する。
より深いネットワークとストライドベースのダウンサンプリングを組み合わせることで、この領域の伝播は、画像の無視できない部分をカバーすることができる。
我々のデータセットは、高解像度の背景にオブジェクトを挿入することで構築され、画像境界に対してターゲットオブジェクトを特定の位置に配置するサブイメージを収穫することができる。
マスクR-CNNの動作を目標位置の選択にわたって探索することにより、画像境界付近、特に画像コーナーにおいて、パフォーマンス劣化の明確なパターンが明らかになる。
論文 参考訳(メタデータ) (2020-12-04T18:00:47Z) - Learning Spatio-Appearance Memory Network for High-Performance Visual
Tracking [79.80401607146987]
既存のオブジェクトトラッキングは通常、フレーム間の視覚的ターゲットにマッチするバウンディングボックスベースのテンプレートを学習する。
本稿では,局所時間メモリネットワークを備え,正確な時空間対応を学習するセグメンテーションに基づくトラッキングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-21T08:12:02Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。