論文の概要: MEMO: Human-like Crisp Edge Detection Using Masked Edge Prediction
- arxiv url: http://arxiv.org/abs/2603.20782v1
- Date: Sat, 21 Mar 2026 12:21:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.081352
- Title: MEMO: Human-like Crisp Edge Detection Using Masked Edge Prediction
- Title(参考訳): MEMO:マスク付きエッジ予測を用いた人間ライクなCrispエッジ検出
- Authors: Jiaxin Cheng, Yue Wu, Yicong Zhou,
- Abstract要約: Masked Edge Prediction MOdelは、クロスエントロピー損失のみを使用して、正確かつクリップなエッジを生成する。
私たちの推測を導く重要な洞察は、太いエッジ予測は通常、信頼度勾配を示すことである。
提案手法は視覚的に魅力的で,後処理のない,人間のようなエッジマップを実現する。
- 参考スコア(独自算出の注目度): 45.91104326433983
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based edge detection models trained with cross-entropy loss often suffer from thick edge predictions, which deviate from the crisp, single-pixel annotations typically provided by humans. While previous approaches to achieving crisp edges have focused on designing specialized loss functions or modifying network architectures, we show that a carefully designed training and inference strategy alone is sufficient to achieve human-like edge quality. In this work, we introduce the Masked Edge Prediction MOdel (MEMO), which produces both accurate and crisp edges using only cross-entropy loss. We first construct a large-scale synthetic edge dataset to pre-train MEMO, enhancing its generalization ability. Subsequent fine-tuning on downstream datasets requires only a lightweight module comprising 1.2\% additional parameters. During training, MEMO learns to predict edges under varying ratios of input masking. A key insight guiding our inference is that thick edge predictions typically exhibit a confidence gradient: high in the center and lower toward the boundaries. Leveraging this, we propose a novel progressive prediction strategy that sequentially finalizes edge predictions in order of prediction confidence, resulting in thinner and more precise contours. Our method achieves visually appealing, post-processing-free, human-like edge maps and outperforms prior methods on crispness-aware evaluations.
- Abstract(参考訳): クロスエントロピー損失で訓練された学習ベースのエッジ検出モデルは、しばしば太いエッジ予測に悩まされる。
これまでは,特定の損失関数の設計やネットワークアーキテクチャの変更に重点を置いてきたが,慎重に設計したトレーニングと推論の戦略だけでは,人間のようなエッジ品質を実現するには十分であることを示す。
本研究では, クロスエントロピー損失のみを用いて, 高精度かつクリップなエッジを生成するMasked Edge Prediction MOdel (MEMO)を提案する。
我々はまず,MEMOを事前訓練するための大規模合成エッジデータセットを構築し,その一般化能力を高めた。
その後のダウンストリームデータセットの微調整では、1.2\%の追加パラメータからなる軽量モジュールのみが必要となる。
トレーニング中、MEMOは入力マスキングの異なる比率でエッジを予測することを学ぶ。
我々の推測を導く重要な洞察は、太いエッジ予測は一般的に、中央が高く、境界に向かって低い信頼勾配を示すことである。
これを利用して、予測信頼性の順にエッジ予測を逐次決定する新しい進行予測戦略を提案し、その結果、より薄く、より正確な輪郭が得られる。
提案手法は、視覚的に魅力的で、後処理のない、人間のようなエッジマップを実現し、クリスペンス対応評価における先行手法よりも優れる。
関連論文リスト
- EasyControlEdge: A Foundation-Model Fine-Tuning for Edge Detection [9.817969756082995]
エッジ検出に画像生成基盤モデルを適用したEasyControlEdgeを提案する。
本研究は,非処理性評価と限られたトレーニングデータによる一貫した利得を示す。
論文 参考訳(メタデータ) (2026-02-18T07:28:09Z) - MS2Edge: Towards Energy-Efficient and Crisp Edge Detection with Multi-Scale Residual Learning in SNNs [12.591111929378906]
ニューラルネットワーク(ANN)によるエッジ検出は目覚ましい進歩を遂げているが、2つの大きな課題に直面している。
事前知識のために大規模な余分なデータと複雑な設計を事前訓練する必要があるため、高いエネルギー消費につながる。
我々はMS2ResNetという新しいスパイクバックボーンを構築し、マルチスケールの残差学習を統合し、欠落した境界線を復元し、クリップエッジを生成する。
論文 参考訳(メタデータ) (2025-11-05T15:56:46Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Learning to utilize image second-order derivative information for crisp edge detection [16.152236524867078]
エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,モデルが真のエッジピクセルを正確に検出するのに役立つ2階微分型マルチスケールコンテキスト拡張モジュール(SDMCM)を提案する。
また、不均衡分布問題を軽減するために、ハイブリッド焦点損失関数(HFL)を構築した。
最後に、エッジ検出のためのSDMCMとBRMに基づくLUS-NetというU字型ネットワークを提案する。
論文 参考訳(メタデータ) (2024-06-09T13:25:02Z) - ADEdgeDrop: Adversarial Edge Dropping for Robust Graph Neural Networks [53.41164429486268]
グラフニューラルネットワーク(GNN)は、近隣ノードからグラフ構造化情報を収集する強力な能力を示した。
GNNの性能は、ノイズや冗長なグラフデータによって引き起こされる一般化の貧弱さと脆弱な堅牢性によって制限される。
本稿では,エッジの除去を誘導する対向エッジ予測器を利用する新しい対向エッジドロップ法 (ADEdgeDrop) を提案する。
論文 参考訳(メタデータ) (2024-03-14T08:31:39Z) - Refined Edge Usage of Graph Neural Networks for Edge Prediction [51.06557652109059]
We propose a novel edge prediction paradigm named Edge-aware Message PassIng neuRal nEtworks (EMPIRE)。
まず,各エッジをトポロジや監督のためにのみ使用するエッジ分割手法を提案する。
監視エッジで接続されたペアと接続されていないペアの差を強調するために、さらにメッセージを重み付けして、その差を反映できる相対的なペアを強調します。
論文 参考訳(メタデータ) (2022-12-25T23:19:56Z) - Learning to Predict Trustworthiness with Steep Slope Loss [69.40817968905495]
本研究では,現実の大規模データセットにおける信頼性の予測問題について検討する。
我々は、先行技術損失関数で訓練された信頼性予測器が、正しい予測と誤った予測の両方を信頼に値するものとみなす傾向があることを観察する。
そこで我々は,2つのスライド状の曲線による不正確な予測から,特徴w.r.t.正しい予測を分離する,新たな急勾配損失を提案する。
論文 参考訳(メタデータ) (2021-09-30T19:19:09Z) - DeepStrip: High Resolution Boundary Refinement [60.00241966809684]
関心領域をストリップ画像に変換し、ストリップ領域の境界予測を計算することを提案する。
対象境界を検出するために,2つの予測層を持つフレームワークを提案する。
我々は、誤報を減らすために、整合性とC0連続性正規化をネットワークに強制する。
論文 参考訳(メタデータ) (2020-03-25T22:44:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。