論文の概要: Edge-Boundary-Texture Loss: A Tri-Class Generalization of Weighted Binary Cross-Entropy for Enhanced Edge Detection
- arxiv url: http://arxiv.org/abs/2507.06569v1
- Date: Wed, 09 Jul 2025 05:47:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.48813
- Title: Edge-Boundary-Texture Loss: A Tri-Class Generalization of Weighted Binary Cross-Entropy for Enhanced Edge Detection
- Title(参考訳): エッジ境界テクスチャ損失:エッジ検出のための重み付きバイナリクロスエントロピーの3クラス一般化
- Authors: Hao Shu,
- Abstract要約: エッジ検出は、オブジェクト境界付近の非エッジピクセルの不明瞭な性質によってしばしば妨げられる。
我々は,エッジ境界テクスチャ損失(EBT)を提案する。これは,画素をエッジ,境界,テクスチャの3つのカテゴリに明確に分割し,それぞれに異なる監督重みを割り当てる新しい目的である。
複数のベンチマークにわたる大規模な実験は、EBT損失の量的および知覚的に優位性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge detection (ED) remains a fundamental task in computer vision, yet its performance is often hindered by the ambiguous nature of non-edge pixels near object boundaries. The widely adopted Weighted Binary Cross-Entropy (WBCE) loss treats all non-edge pixels uniformly, overlooking the structural nuances around edges and often resulting in blurred predictions. In this paper, we propose the Edge-Boundary-Texture (EBT) loss, a novel objective that explicitly divides pixels into three categories, edge, boundary, and texture, and assigns each a distinct supervisory weight. This tri-class formulation enables more structured learning by guiding the model to focus on both edge precision and contextual boundary localization. We theoretically show that the EBT loss generalizes the WBCE loss, with the latter becoming a limit case. Extensive experiments across multiple benchmarks demonstrate the superiority of the EBT loss both quantitatively and perceptually. Furthermore, the consistent use of unified hyperparameters across all models and datasets, along with robustness to their moderate variations, indicates that the EBT loss requires minimal fine-tuning and is easily deployable in practice.
- Abstract(参考訳): エッジ検出(ED)はコンピュータビジョンの基本的な課題であるが、その性能はオブジェクト境界に近い非エッジピクセルの曖昧さによって妨げられることが多い。
広く採用されているWeighted Binary Cross-Entropy (WBCE)損失は、すべての非エッジピクセルを均一に扱い、エッジの周りの構造的ニュアンスを見下ろし、しばしばぼやけた予測をもたらす。
本稿では,エッジ境界テクスチャ(EBT)損失(エッジ境界テクスチャ)を提案する。これは,画素を3つのカテゴリ,エッジ,境界,テクスチャに明確に分割し,それぞれに異なる監督重みを割り当てる新しい目的である。
この三級の定式化は、モデルにエッジ精度とコンテキスト境界ローカライゼーションの両方に焦点を合わせることによって、より構造化された学習を可能にする。
理論的には、EBT損失はWBCE損失を一般化し、後者は制限ケースとなる。
複数のベンチマークにわたる大規模な実験は、EBT損失の量的および知覚的に優位性を示す。
さらに、すべてのモデルとデータセットをまたいだ統一されたハイパーパラメータの使用と、その適度な変動に対する堅牢性は、ETT損失が最小限の微調整を必要とし、実際に容易にデプロイ可能であることを示唆している。
関連論文リスト
- SED-MVS: Segmentation-Driven and Edge-Aligned Deformation Multi-View Stereo with Depth Restoration and Occlusion Constraint [11.165686149180054]
SED-MVSは、セグメント化駆動およびエッジ整合のパッチ変形に対して、単光分割と多軌道拡散戦略を採用する。
具体的には、予想外のエッジスキッピングを防止するために、まず、パッチ変形をガイドするディープエッジガイダンスとしてSAM2を使用し、その後、パッチがディープエッジに包括的に整合していることを保証するマルチ軌道拡散戦略を用いる。
論文 参考訳(メタデータ) (2025-03-17T21:07:44Z) - Rethinking Edge Detection through Perceptual Asymmetry: The SWBCE Loss [0.0]
本稿では,Symmetrization Weighted Binary Cross-Entropy (SWBCE)ロス関数を提案する。
ラベル誘導学習と予測誘導学習のバランスをとることで、SWBCEは偽陽性を効果的に抑制しつつ高いエッジリコールを維持する。
これらの結果は、高品質エッジ予測におけるSWBCEの有効性と、関連する視覚タスクへの適用可能性を示している。
論文 参考訳(メタデータ) (2025-01-23T04:10:31Z) - SuperEdge: Towards a Generalization Model for Self-Supervised Edge
Detection [2.912976132828368]
最先端のピクセルワイドアノテーションは労働集約的であり、手作業で取得すると矛盾する。
本稿では, マルチレベルのマルチホログラフィー技術を用いて, 合成データセットから実世界のデータセットへアノテーションを転送する, エッジ検出のための新しい自己教師型アプローチを提案する。
提案手法は,手動の注釈付きエッジラベルへの依存性を排除し,多様なデータセット間の一般化性を向上させる。
論文 参考訳(メタデータ) (2024-01-04T15:21:53Z) - 2D Feature Distillation for Weakly- and Semi-Supervised 3D Semantic
Segmentation [92.17700318483745]
合成訓練された2Dセマンティックセマンティックセグメンテーションネットワークから高レベル特徴情報を蒸留するアイデアに基づく画像誘導ネットワーク(IGNet)を提案する。
IGNetは、ScribbleKITTI上の弱い教師付きLiDARセマンティックセマンティックセグメンテーションの最先端の結果を達成し、8%のラベル付きポイントしか持たない完全な教師付きトレーニングに対して最大98%のパフォーマンスを誇っている。
論文 参考訳(メタデータ) (2023-11-27T07:57:29Z) - Temporal Action Localization with Enhanced Instant Discriminability [66.76095239972094]
時間的行動検出(TAD)は、すべての行動境界とその対応するカテゴリを、トリミングされていないビデオで検出することを目的としている。
本稿では,既存の手法による動作境界の不正確な予測を解決するために,TriDetという一段階のフレームワークを提案する。
実験結果から,複数のTADデータセット上でのTriDetの堅牢性と最先端性能が示された。
論文 参考訳(メタデータ) (2023-09-11T16:17:50Z) - ECT: Fine-grained Edge Detection with Learned Cause Tokens [19.271691951077617]
汎用エッジと細粒度エッジを逐次予測する2段階トランスフォーマーネットワークを提案する。
提案手法をBSDS-RINDおよび複数の新たに派生したベンチマーク上で評価し,新たな最先端結果を得た。
論文 参考訳(メタデータ) (2023-08-06T11:37:55Z) - On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2022-09-19T03:46:13Z) - InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.39674800972182]
逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。
論文 参考訳(メタデータ) (2021-04-06T18:52:45Z) - Active Boundary Loss for Semantic Segmentation [58.72057610093194]
本稿では,セマンティックセグメンテーションのための新しいアクティブ境界損失を提案する。
エンド・ツー・エンドのトレーニングにおいて、予測境界とグランド・トゥルース・バウンダリのアライメントを徐々に促進することができる。
実験結果から, アクティブ境界損失によるトレーニングは, 境界Fスコアと平均インターセクションオーバ・ユニオンを効果的に改善できることが示された。
論文 参考訳(メタデータ) (2021-02-04T15:47:54Z) - Edge-Preserving Guided Semantic Segmentation for VIPriors Challenge [3.435043566706133]
現在の最先端およびディープラーニングに基づくセマンティックセマンティックセグメンテーション技術は、よく訓練することは難しい。
付加的な事前情報を得るためのエッジ保存ガイダンスを提案する。
実験により,提案手法は小型のトレーニングセットで優れた性能が得られることを示した。
論文 参考訳(メタデータ) (2020-07-17T11:49:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。