論文の概要: Learning to utilize gradient information for crisp edge detection
- arxiv url: http://arxiv.org/abs/2406.05779v1
- Date: Sun, 9 Jun 2024 13:25:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 18:07:23.192901
- Title: Learning to utilize gradient information for crisp edge detection
- Title(参考訳): 勾配情報を利用したクロップエッジ検出の学習
- Authors: Changsong Liu, Wei Zhang, Yanyan Liu, Yuming Li, Wenlin Li, Yimeng Fan, Liang Zhang,
- Abstract要約: エッジ検出はコンピュータビジョンの基本課題であり、ディープ畳み込みニューラルネットワーク(DCNN)の開発において大きな進歩を遂げた。
本研究では,この問題を効果的に解決する手法を提案する。
提案手法は,軽量な事前学習バックボーン,マルチスケールコンテキスト拡張モジュール集約勾配情報(MCGI),境界補正モジュール(BCM),境界修正モジュール(BRM)から構成される。
- 参考スコア(独自算出の注目度): 12.782690873064723
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge detection is a fundamental task in computer vision and it has made great progress under the development of deep convolutional neural networks (DCNNs), some of them have achieved a beyond human-level performance. However, recent top-performing edge detection methods tend to generate thick and blurred edge lines. In this work, we propose an effective method to solve this problem. Our approach consists of a lightweight pre-trained backbone, multi-scale contextual enhancement module aggregating gradient information (MCGI), boundary correction module (BCM), and boundary refinement module (BRM). In addition to this, we construct a novel hybrid loss function based on the Tversky index for solving the issue of imbalanced pixel distribution. We test our method on three standard benchmarks and the experiment results illustrate that our method improves the visual effect of edge maps and achieves a top performance among several state-of-the-art methods on the BSDS500 dataset (ODS F-score in standard evaluation is 0.829, in crispness evaluation is 0.720), NYUD-V2 dataset (ODS F-score in standard evaluation is 0.768, in crispness evaluation is \textbf{0.546}), and BIPED dataset (ODS F-score in standard evaluation is 0.903).
- Abstract(参考訳): エッジ検出はコンピュータビジョンの基本課題であり、ディープ畳み込みニューラルネットワーク(DCNN)の開発の下で大きな進歩を遂げた。
しかし,近年のエッジ検出手法では,厚くぼやけたエッジ線を生成する傾向にある。
本研究では,この問題を効果的に解決する手法を提案する。
提案手法は,軽量な事前学習バックボーン,マルチスケールコンテキスト拡張モジュール集約勾配情報(MCGI),境界補正モジュール(BCM),境界修正モジュール(BRM)から構成される。
さらに,不均衡な画素分布の問題を解くために,Tversky指数に基づく新たなハイブリッド損失関数を構築した。
提案手法を3つの標準ベンチマークで検証した結果,提案手法はエッジマップの視覚的効果を改善し,BSDS500データセット(標準評価ではODS Fスコア0.720),NYUD-V2データセット(標準評価ではODS Fスコア0.768),BIPEDデータセット(標準評価ではODS Fスコア0.903)上での最先端性能を実現することが示された。
関連論文リスト
- Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Cycle Pixel Difference Network for Crisp Edge Detection [12.642567744605183]
本稿では、画像勾配情報と現代の畳み込み操作を統合する新しいサイクル画素差分畳み込み(CPDC)を提案する。
既存手法のエッジ厚み問題に対処するため,マルチスケール情報拡張モジュール(MSEM)を構築した。
我々のアプローチは、エッジ検出におけるこれらの課題に対処するための新しい視点を提供する。
論文 参考訳(メタデータ) (2024-09-06T13:28:05Z) - NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth
Supervision for Indoor Multi-View 3D Detection [72.0098999512727]
NeRF-Detは、NeRFを用いた屋内マルチビュー3次元検出において、表現学習の強化による優れた性能を実現している。
セマンティックエンハンスメント(セマンティックエンハンスメント)、パースペクティブ・アウェア・サンプリング(パースペクティブ・アウェア・サンプリング)、および順序深度監視を含む3つのソリューションを提案する。
結果として得られたアルゴリズムであるNeRF-Det++は、ScanNetV2とAR KITScenesデータセットで魅力的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-22T11:48:06Z) - DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection [20.278655159290302]
本稿では,DiffusionEdgeと呼ばれる汎用エッジ検出タスクに対する最初の拡散モデルを提案する。
最終的な性能を維持しつつ、高価な計算資源を避けるため、遅延空間にDPMを適用し、古典的なクロスエントロピー損失を可能にする。
すべての技術的設計で、DiffusionEdgeは限られたリソースで安定的にトレーニングすることができ、より少ない拡張戦略で、鮮明で正確なエッジマップを予測できる。
論文 参考訳(メタデータ) (2024-01-04T02:20:54Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - Learning Weighting Map for Bit-Depth Expansion within a Rational Range [64.15915577164894]
ビット深化(BDE)は、低ビット深化(LBD)ソースから高ビット深化(HBD)画像を表示する新興技術の1つである。
既存のBDEメソッドは、様々なBDE状況に対して統一的なソリューションを持っていない。
我々は,各画素の重みを求めるためにビット復元ネットワーク(BRNet)を設計し,補充値の比率を合理的範囲内で示す。
論文 参考訳(メタデータ) (2022-04-26T02:27:39Z) - One-Stage Deep Edge Detection Based on Dense-Scale Feature Fusion and
Pixel-Level Imbalance Learning [5.370848116287344]
後処理なしで高品質なエッジ画像を生成することができる一段階ニューラルネットワークモデルを提案する。
提案モデルでは、トレーニング済みのニューラルモデルをエンコーダとして使用する古典的なエンコーダデコーダフレームワークを採用している。
本稿では,エッジ画像の画素レベルの不均衡に対処する新たな損失関数を提案する。
論文 参考訳(メタデータ) (2022-03-17T15:26:00Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Learning Crisp Edge Detector Using Logical Refinement Network [29.59728791893451]
本稿では,セグメント化とエッジマップの論理的関係を動機とした,クリップエッジ検出のための新しい論理改良ネットワークを提案する。
このネットワークは、結合オブジェクトとエッジ検出ネットワークと、より正確で、よりクリアで、より薄い高品質のバイナリエッジマップを予測するクリップエッジリファインメントネットワークで構成されている。
論文 参考訳(メタデータ) (2020-07-24T11:12:48Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。