論文の概要: A new baseline for edge detection: Make Encoder-Decoder great again
- arxiv url: http://arxiv.org/abs/2409.14976v2
- Date: Sun, 24 Nov 2024 21:05:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:15:20.689269
- Title: A new baseline for edge detection: Make Encoder-Decoder great again
- Title(参考訳): エッジ検出のための新しいベースライン:Encoder-Decoderを再び素晴らしいものに
- Authors: Yachuan Li, Xavier Soria Pomab, Yongke Xi, Guanlin Li, Chaozhi Yang, Qian Xiao, Yun Bai, Zongmin LI,
- Abstract要約: 提案されたNew Baseline for Edge Detection (NBED)は、複数のエッジ検出ベンチマークで一貫してパフォーマンスを向上する。
BSDS500におけるNBEDのODSは0.838であり、最先端のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 3.3171122239461193
- License:
- Abstract: The performance of deep learning based edge detector has far exceeded that of humans, but the huge computational cost and complex training strategy hinder its further development and application. In this paper, we eliminate these complexities with a vanilla encoder-decoder based detector. Firstly, we design a bilateral encoder to decouple the extraction process of location features and semantic features. Since the location branch no longer provides cues for the semantic branch, the richness of features can be further compressed, which is the key to make our model more compact. We propose a cascaded feature fusion decoder, where the location features are progressively refined by semantic features. The refined location features are the only basis for generating the edge map. The coarse original location features and semantic features are avoided from direct contact with the final result. So the noise in the location features and the location error in the semantic features can be suppressed in the generated edge map. The proposed New Baseline for Edge Detection (NBED) achieves superior performance consistently across multiple edge detection benchmarks, even compared with those methods with huge computational cost and complex training strategy. The ODS of NBED on BSDS500 is 0.838, achieving state-of-the-art performance. Our study shows that what really matters in the current edge detection is high-quality features, and we can make the encoder-decoder based detector great again even without complex training strategies and huge computational cost. The code is available at https://github.com/Li-yachuan/NBED.
- Abstract(参考訳): 深層学習に基づくエッジ検出器の性能は人類よりはるかに上回っているが、膨大な計算コストと複雑な訓練戦略は、そのさらなる開発と応用を妨げる。
本稿では,バニラエンコーダデコーダを用いた検出器を用いて,これらの複雑さを除去する。
まず、位置特徴と意味的特徴の抽出過程を分離する両側エンコーダを設計する。
ロケーションブランチはもはやセマンティックブランチのキューを提供しないので、機能のリッチさをさらに圧縮することができる。
位置特徴を意味的特徴によって徐々に洗練するカスケード機能融合デコーダを提案する。
洗練された位置特徴はエッジマップを生成するための唯一の基盤である。
粗い元の位置特徴と意味的特徴は、最終結果と直接接触することを避ける。
したがって、生成したエッジマップにおいて、位置特徴のノイズと意味特徴の位置情報誤差を抑えることができる。
提案したNew Baseline for Edge Detection (NBED)は、計算コストと複雑なトレーニング戦略を持つ手法と比較しても、複数のエッジ検出ベンチマークで一貫して優れたパフォーマンスを実現している。
BSDS500におけるNBEDのODSは0.838であり、最先端のパフォーマンスを実現している。
我々の研究は、現在のエッジ検出で本当に重要なのは高品質な特徴であり、複雑なトレーニング戦略と膨大な計算コストを伴わずにエンコーダデコーダベースの検出器を再び素晴らしいものにすることができることを示している。
コードはhttps://github.com/Li-yachuan/NBEDで公開されている。
関連論文リスト
- Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T12:39:56Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive
Sparse Anchor Generation [50.01244854344167]
適応スパースアンカージェネレータ(ASAG)の提案により、スパース検出器と密度検出器のパフォーマンスギャップを橋渡しする。
ASAGは、グリッドではなくパッチの動的なアンカーを予測することで、機能競合の問題を軽減する。
提案手法は高密度な手法より優れ,高速かつ高精度なトレードオフを実現する。
論文 参考訳(メタデータ) (2023-08-18T02:06:49Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - DAC: Detector-Agnostic Spatial Covariances for Deep Local Features [11.494662473750505]
現在の深部視覚特徴検出器は検出された特徴の空間的不確かさをモデル化していない。
本稿では,事前訓練したディープ特徴検出器に接続可能な2つのポストホック共分散推定法を提案する。
論文 参考訳(メタデータ) (2023-05-20T17:43:09Z) - DPC: Unsupervised Deep Point Correspondence via Cross and Self
Construction [29.191330510706408]
本稿では, 形状構造に基づく点雲間のリアルタイム非剛性密度対応法を提案する。
提案手法はディープポイント対応 (DPC) と呼ばれ, 従来の手法と比較してトレーニングデータのごく一部を必要とする。
提案手法は,最近の最先端対応手法と比較して性能が向上する。
論文 参考訳(メタデータ) (2021-10-16T18:41:13Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Hybrid-Attention Guided Network with Multiple Resolution Features for
Person Re-Identification [30.285126447140254]
本稿では,ハイレベルな特徴を学習する際の情報損失を低減するために,ハイレベルな埋め込みと低レベルな埋め込みを融合した新しい人物再IDモデルを提案する。
また,対象物に関するより識別的な特徴を抽出することを目的とした,空間的およびチャネル的注意機構をモデルに導入する。
論文 参考訳(メタデータ) (2020-09-16T08:12:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。