論文の概要: MatchED: Crisp Edge Detection Using End-to-End, Matching-based Supervision
- arxiv url: http://arxiv.org/abs/2602.20689v1
- Date: Tue, 24 Feb 2026 08:45:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.681369
- Title: MatchED: Crisp Edge Detection Using End-to-End, Matching-based Supervision
- Title(参考訳): Matched: End-to-End, Matching-based Supervision を用いたCrspエッジ検出
- Authors: Bedrettin Cetinkaya, Sinan Kalkan, Emre Akbas,
- Abstract要約: MethodLPPは軽量でたったの$sim$21Kの追加パラメータとプラグアンドプレイのマッチングベースの監視モジュールである。
MethodLPPはベースラインモデルと比較して平均犯罪度(AC)を最大2--4$times$まで引き上げる。
MethodLPPは、標準の事後処理と初めて一致するか、または超えるSOTA性能を達成する。
- 参考スコア(独自算出の注目度): 19.218741065333013
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating crisp, i.e., one-pixel-wide, edge maps remains one of the fundamental challenges in edge detection, affecting both traditional and learning-based methods. To obtain crisp edges, most existing approaches rely on two hand-crafted post-processing algorithms, Non-Maximum Suppression (NMS) and skeleton-based thinning, which are non-differentiable and hinder end-to-end optimization. Moreover, all existing crisp edge detection methods still depend on such post-processing to achieve satisfactory results. To address this limitation, we propose \MethodLPP, a lightweight, only $\sim$21K additional parameters, and plug-and-play matching-based supervision module that can be appended to any edge detection model for joint end-to-end learning of crisp edges. At each training iteration, \MethodLPP performs one-to-one matching between predicted and ground-truth edges based on spatial distance and confidence, ensuring consistency between training and testing protocols. Extensive experiments on four popular datasets demonstrate that integrating \MethodLPP substantially improves the performance of existing edge detection models. In particular, \MethodLPP increases the Average Crispness (AC) metric by up to 2--4$\times$ compared to baseline models. Under the crispness-emphasized evaluation (CEval), \MethodLPP further boosts baseline performance by up to 20--35\% in ODS and achieves similar gains in OIS and AP, achieving SOTA performance that matches or surpasses standard post-processing for the first time. Code is available at https://cvpr26-matched.github.io.
- Abstract(参考訳): クリップ、すなわち1ピクセル規模のエッジマップの生成は、従来法と学習法の両方に影響を及ぼす、エッジ検出の根本的な課題の1つとして残されている。
クリップエッジを得るためには、既存のほとんどのアプローチは、2つの手作りのポストプロセッシングアルゴリズム、Non-Maximum Suppression (NMS) とスケルトンベースのシンニングに依存しており、これは非微分可能でエンドツーエンドの最適化を妨げている。
さらに, 既存のクランプエッジ検出手法は, 良好な結果を得るために, 後処理に依存している。
この制限に対処するために,軽量な$\sim$21Kの追加パラメータである ‘MethodLPP と,任意のエッジ検出モデルに付加可能なプラグイン・アンド・プレイ・マッチングベースの監視モジュールを提案する。
各トレーニングイテレーションにおいて、MethodLPPは、空間距離と信頼性に基づいて予測されたエッジと接地真実のエッジを1対1でマッチングし、トレーニングとテストプロトコル間の一貫性を確保する。
一般的な4つのデータセットに対する大規模な実験により、‘MethodLPP’を統合することで、既存のエッジ検出モデルの性能が大幅に向上することが示された。
特に、MethodLPP はベースラインモデルと比較して平均犯罪度 (AC) を 2--4$\times$ まで増加させる。
クライスペンス強調評価(CEval)の下では,ODSでは最大20~35倍のベースライン性能が向上し,OISとAPでも同様に向上する。
コードはhttps://cvpr26-matched.github.ioで公開されている。
関連論文リスト
- AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:47:16Z) - ALoRE: Efficient Visual Adaptation via Aggregating Low Rank Experts [71.91042186338163]
ALoREは、Kroneckerによって構築された超複素パラメータ化空間をAggregate Low Rank Expertsに再利用する新しいPETL法である。
巧妙な設計のおかげで、ALoREは無視できる余分なパラメータを保持し、凍ったバックボーンに強制的にマージできる。
論文 参考訳(メタデータ) (2024-12-11T12:31:30Z) - Learning to utilize image second-order derivative information for crisp edge detection [16.152236524867078]
エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,モデルが真のエッジピクセルを正確に検出するのに役立つ2階微分型マルチスケールコンテキスト拡張モジュール(SDMCM)を提案する。
また、不均衡分布問題を軽減するために、ハイブリッド焦点損失関数(HFL)を構築した。
最後に、エッジ検出のためのSDMCMとBRMに基づくLUS-NetというU字型ネットワークを提案する。
論文 参考訳(メタデータ) (2024-06-09T13:25:02Z) - Decoupled Prototype Learning for Reliable Test-Time Adaptation [50.779896759106784]
テスト時間適応(TTA)は、推論中にトレーニング済みのソースモデルをターゲットドメインに継続的に適応させるタスクである。
1つの一般的なアプローチは、推定擬似ラベルによるクロスエントロピー損失を伴う微調整モデルである。
本研究は, 各試料の分類誤差を最小化することで, クロスエントロピー損失の脆弱性がラベルノイズを引き起こすことを明らかにした。
本稿では,プロトタイプ中心の損失計算を特徴とする新しいDPL法を提案する。
論文 参考訳(メタデータ) (2024-01-15T03:33:39Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - A Strong Baseline for Point Cloud Registration via Direct Superpoints Matching [7.308509114539376]
本稿では,グローバルなマッチング方式でスーパーポイントの対応を見つけるための,シンプルで効果的なベースラインを提案する。
我々の単純で効果的なベースラインは、3つのデータセットの最先端メソッドと同等かそれ以上の結果を示している。
論文 参考訳(メタデータ) (2023-07-03T21:33:40Z) - Edge-aware Plug-and-play Scheme for Semantic Segmentation [4.297988192695948]
提案手法は, 改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できる。
実験結果から,提案手法は改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できることが示唆された。
論文 参考訳(メタデータ) (2023-03-18T02:17:37Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。