論文の概要: Cycle Pixel Difference Network for Crisp Edge Detection
- arxiv url: http://arxiv.org/abs/2409.04272v1
- Date: Fri, 6 Sep 2024 13:28:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-09 15:44:50.409299
- Title: Cycle Pixel Difference Network for Crisp Edge Detection
- Title(参考訳): Crispエッジ検出のためのCycle Pixel差分ネットワーク
- Authors: Changsong Liu, Wei Zhang, Yanyan Liu, Mingyang Li, Wenlin Li, Yimeng Fan, Xiangnan Bai, Liang Zhangd,
- Abstract要約: 本稿では、画像勾配情報と現代の畳み込み操作を統合する新しいサイクル画素差分畳み込み(CPDC)を提案する。
既存手法のエッジ厚み問題に対処するため,マルチスケール情報拡張モジュール(MSEM)を構築した。
我々のアプローチは、エッジ検出におけるこれらの課題に対処するための新しい視点を提供する。
- 参考スコア(独自算出の注目度): 12.642567744605183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge detection, as a fundamental task in computer vision, has garnered increasing attention. The advent of deep learning has significantly advanced this field. However, recent deep learning-based methods which rely on large-scale pre-trained weights cannot be trained from scratch, with very limited research addressing this issue. This paper proposes a novel cycle pixel difference convolution (CPDC), which effectively integrates image gradient information with modern convolution operations. Based on the CPDC, we develop a U-shape encoder-decoder model named CPD-Net, which is a purely end-to-end network. Additionally, to address the issue of edge thickness produced by most existing methods, we construct a multi-scale information enhancement module (MSEM) to enhance the discriminative ability of the model, thereby generating crisp and clean contour maps. Comprehensive experiments conducted on three standard benchmarks demonstrate that our method achieves competitive performance on the BSDS500 dataset (ODS=0.813), NYUD-V2 (ODS=0.760), and BIPED dataset (ODS=0.898). Our approach provides a novel perspective for addressing these challenges in edge detection.
- Abstract(参考訳): エッジ検出はコンピュータビジョンの基本課題であり、注目を集めている。
ディープラーニングの出現はこの分野を大きく前進させた。
しかし、大規模な事前訓練された重量に依存する最近のディープラーニングベースの手法は、ゼロから訓練することはできない。
本稿では,画像勾配情報と最新の畳み込み操作を効果的に統合する新しいサイクル画素差分畳み込み(CPDC)を提案する。
CPDCに基づいて、純粋にエンドツーエンドのネットワークであるPD-Netと呼ばれるU字型エンコーダデコーダモデルを開発する。
さらに,既存手法のエッジ厚み問題に対処するため,モデルの識別能力を高めるため,マルチスケール情報拡張モジュール(MSEM)を構築し,鮮明でクリーンな輪郭マップを生成する。
提案手法はBSDS500データセット(ODS=0.813)、NYUD-V2データセット(ODS=0.760)、BIPEDデータセット(ODS=0.898)で競合性能を発揮することを示す。
我々のアプローチは、エッジ検出におけるこれらの課題に対処するための新しい視点を提供する。
関連論文リスト
- Learning to utilize image second-order derivative information for crisp edge detection [13.848361661516595]
エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,モデルが真のエッジピクセルを正確に検出するのに役立つ2階微分型マルチスケールコンテキスト拡張モジュール(SDMCM)を提案する。
また、不均衡分布問題を軽減するために、ハイブリッド焦点損失関数(HFL)を構築した。
最後に、エッジ検出のためのSDMCMとBRMに基づくLUS-NetというU字型ネットワークを提案する。
論文 参考訳(メタデータ) (2024-06-09T13:25:02Z) - 3D Neural Edge Reconstruction [61.10201396044153]
本研究では,線と曲線に焦点をあてて3次元エッジ表現を学習する新しい手法であるEMAPを紹介する。
多視点エッジマップから無符号距離関数(UDF)の3次元エッジ距離と方向を暗黙的に符号化する。
この神経表現の上に、推定されたエッジ点とその方向から3次元エッジを頑健に抽象化するエッジ抽出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T17:23:51Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - Lightweight Monocular Depth Estimation with an Edge Guided Network [34.03711454383413]
本稿では,新しいエッジガイド深度推定ネットワーク(EGD-Net)を提案する。
特に、軽量なエンコーダデコーダアーキテクチャから始め、エッジガイダンスブランチを組み込む。
コンテクスト情報とエッジアテンション特徴を集約するために,トランスフォーマーをベースとした機能アグリゲーションモジュールを設計する。
論文 参考訳(メタデータ) (2022-09-29T14:45:47Z) - Rethinking Unsupervised Neural Superpixel Segmentation [6.123324869194195]
CNNによるスーパーピクセルセグメンテーションのための教師なし学習が研究されている。
このようなネットワークの有効性を改善するために,3つの重要な要素を提案する。
BSDS500データセットを実験した結果,提案手法の意義を示す証拠が得られた。
論文 参考訳(メタデータ) (2022-06-21T09:30:26Z) - Proximal PanNet: A Model-Based Deep Network for Pansharpening [11.695233311615498]
本稿では,モデルに基づく手法と深層学習手法を組み合わせることで,パンシャーピングのための新しいディープネットワークを提案する。
畳み込みニューラルネットワークを用いて近位演算子を学習することにより、反復アルゴリズムをPanNetと呼ばれるディープネットワークに展開する。
いくつかのベンチマークデータセットの実験結果から、我々のネットワークは定量的にも定性的にも他の先進的な手法よりも優れた性能を示している。
論文 参考訳(メタデータ) (2022-02-12T15:49:13Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Densely Nested Top-Down Flows for Salient Object Detection [137.74130900326833]
本稿では,物体検出におけるトップダウンモデリングの役割を再考する。
密度の高いトップダウンフロー(DNTDF)ベースのフレームワークを設計する。
DNTDFのすべての段階において、高いレベルの特徴はプログレッシブ圧縮ショートカットパス(PCSP)を介して読み込まれる。
論文 参考訳(メタデータ) (2021-02-18T03:14:02Z) - Compressive spectral image classification using 3D coded convolutional
neural network [12.67293744927537]
本稿では、符号化開口スナップショット分光画像(CASSI)の測定に基づく新しい深層学習HIC手法を提案する。
3次元符号化畳み込みニューラルネットワーク(3D-CCNN)と呼ばれる新しいタイプのディープラーニング戦略を提案し,その分類問題を効率的に解く。
ディープラーニングネットワークと符号化開口部の相乗効果を利用して、分類精度を効果的に向上する。
論文 参考訳(メタデータ) (2020-09-23T15:05:57Z) - 2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors
Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。
具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。
提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文 参考訳(メタデータ) (2020-08-10T09:50:28Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。