論文の概要: Learning to utilize image second-order derivative information for crisp edge detection
- arxiv url: http://arxiv.org/abs/2406.05779v2
- Date: Mon, 24 Jun 2024 06:07:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-26 00:23:38.133740
- Title: Learning to utilize image second-order derivative information for crisp edge detection
- Title(参考訳): 画像二階微分情報を用いたクロップエッジ検出の学習
- Authors: Changsong Liu, Wei Zhang, Yanyan Liu, Yuming Li, Mingyang Li, Wenlin Li, Yimeng Fan, Liang Zhang,
- Abstract要約: エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,2階微分に基づくマルチスケールコンテキスト拡張モジュールを提案する。
- 参考スコア(独自算出の注目度): 16.152236524867078
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge detection is a fundamental task in computer vision. It has made great progress under the development of deep convolutional neural networks (DCNNs), some of which have achieved a beyond human-level performance. However, recent top-performing edge detection methods tend to generate thick and noisy edge lines. In this work, we solve this problem from two aspects: (1) leveraging the precise edge pixel location characteristics of second-order image derivatives, and (2) alleviating the issue of imbalanced pixel distribution. We propose a second-order derivative-based multi-scale contextual enhancement module (SDMC) to help the model locate true edge pixels accurately and construct a hybrid focal loss function (HFL) to alleviate the imbalanced distribution issue. We test our method on three standard benchmarks and the experiment results illustrate that our method can make the output edge maps crisp and achieves a top performance among several state-of-the-art methods on the BSDS500 dataset (ODS F-score in standard evaluation is 0.829, in crispness evaluation is 0.720), NYUD-V2 dataset (ODS F-score in standard evaluation is 0.768, in crispness evaluation is 0.546), and BIPED dataset (ODS F-score in standard evaluation is 0.903).
- Abstract(参考訳): エッジ検出はコンピュータビジョンの基本課題である。
深層畳み込みニューラルネットワーク(DCNN)の開発において大きな進歩を遂げた。
しかし、近年の最先端エッジ検出手法は、厚くノイズの多いエッジ線を生成する傾向にある。
本研究では,(1)2階画像の正確なエッジ画素位置特性を活用すること,(2)不均衡な画素分布の問題を緩和すること,の2つの側面からこの問題を解決する。
本研究では,モデルが真のエッジ画素を正確に検出するのに役立つ2階微分型マルチスケールコンテキスト拡張モジュール (SDMC) を提案し,不均衡分布問題を緩和するハイブリッド焦点損失関数 (HFL) を構築した。
提案手法を3つの標準ベンチマークで検証した結果,提案手法はBSDS500データセット(標準評価では 0.829,基準評価では 0.720),NYUD-V2 データセット(標準評価では 0.768,基準評価では 0.546,標準評価では 0.903),BIPED データセット(標準評価では ODS F-スコア)において,出力エッジマップをクリップし,最高性能を達成することができることがわかった。
関連論文リスト
- Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Cycle Pixel Difference Network for Crisp Edge Detection [12.642567744605183]
本稿では、画像勾配情報と現代の畳み込み操作を統合する新しいサイクル画素差分畳み込み(CPDC)を提案する。
既存手法のエッジ厚み問題に対処するため,マルチスケール情報拡張モジュール(MSEM)を構築した。
我々のアプローチは、エッジ検出におけるこれらの課題に対処するための新しい視点を提供する。
論文 参考訳(メタデータ) (2024-09-06T13:28:05Z) - NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth
Supervision for Indoor Multi-View 3D Detection [72.0098999512727]
NeRF-Detは、NeRFを用いた屋内マルチビュー3次元検出において、表現学習の強化による優れた性能を実現している。
セマンティックエンハンスメント(セマンティックエンハンスメント)、パースペクティブ・アウェア・サンプリング(パースペクティブ・アウェア・サンプリング)、および順序深度監視を含む3つのソリューションを提案する。
結果として得られたアルゴリズムであるNeRF-Det++は、ScanNetV2とAR KITScenesデータセットで魅力的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-22T11:48:06Z) - DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection [20.278655159290302]
本稿では,DiffusionEdgeと呼ばれる汎用エッジ検出タスクに対する最初の拡散モデルを提案する。
最終的な性能を維持しつつ、高価な計算資源を避けるため、遅延空間にDPMを適用し、古典的なクロスエントロピー損失を可能にする。
すべての技術的設計で、DiffusionEdgeは限られたリソースで安定的にトレーニングすることができ、より少ない拡張戦略で、鮮明で正確なエッジマップを予測できる。
論文 参考訳(メタデータ) (2024-01-04T02:20:54Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - Learning Weighting Map for Bit-Depth Expansion within a Rational Range [64.15915577164894]
ビット深化(BDE)は、低ビット深化(LBD)ソースから高ビット深化(HBD)画像を表示する新興技術の1つである。
既存のBDEメソッドは、様々なBDE状況に対して統一的なソリューションを持っていない。
我々は,各画素の重みを求めるためにビット復元ネットワーク(BRNet)を設計し,補充値の比率を合理的範囲内で示す。
論文 参考訳(メタデータ) (2022-04-26T02:27:39Z) - One-Stage Deep Edge Detection Based on Dense-Scale Feature Fusion and
Pixel-Level Imbalance Learning [5.370848116287344]
後処理なしで高品質なエッジ画像を生成することができる一段階ニューラルネットワークモデルを提案する。
提案モデルでは、トレーニング済みのニューラルモデルをエンコーダとして使用する古典的なエンコーダデコーダフレームワークを採用している。
本稿では,エッジ画像の画素レベルの不均衡に対処する新たな損失関数を提案する。
論文 参考訳(メタデータ) (2022-03-17T15:26:00Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Learning Crisp Edge Detector Using Logical Refinement Network [29.59728791893451]
本稿では,セグメント化とエッジマップの論理的関係を動機とした,クリップエッジ検出のための新しい論理改良ネットワークを提案する。
このネットワークは、結合オブジェクトとエッジ検出ネットワークと、より正確で、よりクリアで、より薄い高品質のバイナリエッジマップを予測するクリップエッジリファインメントネットワークで構成されている。
論文 参考訳(メタデータ) (2020-07-24T11:12:48Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。