論文の概要: Rethinking Edge Detection through Perceptual Asymmetry: The SWBCE Loss
- arxiv url: http://arxiv.org/abs/2501.13365v2
- Date: Sun, 25 May 2025 10:25:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 14:32:53.184564
- Title: Rethinking Edge Detection through Perceptual Asymmetry: The SWBCE Loss
- Title(参考訳): 知覚非対称性によるエッジ検出の再考:SWBCE損失
- Authors: Hao Shu,
- Abstract要約: 本稿では,Symmetrization Weighted Binary Cross-Entropy (SWBCE)ロス関数を提案する。
ラベル誘導学習と予測誘導学習のバランスをとることで、SWBCEは偽陽性を効果的に抑制しつつ高いエッジリコールを維持する。
これらの結果は、高品質エッジ予測におけるSWBCEの有効性と、関連する視覚タスクへの適用可能性を示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge detection (ED) is a fundamental component in many computer vision tasks, yet achieving both high quantitative accuracy and perceptual quality remains a significant challenge. In this paper, we propose the Symmetrization Weighted Binary Cross-Entropy (SWBCE) loss function, a novel approach that addresses this issue by leveraging the inherent asymmetry in human edge perception, where edge decisions require stronger justification than non-edge ones. By balancing label-guided and prediction-guided learning, SWBCE maintains high edge recall while effectively suppressing false positives. Extensive experiments across multiple datasets and baseline models, along with comparisons to prior loss functions, demonstrate that our method consistently improves both the quantitative metrics and perceptual quality of ED results. These findings underscore the effectiveness of SWBCE for high-quality edge prediction and its potential applicability to related vision tasks.
- Abstract(参考訳): エッジ検出(ED)は多くのコンピュータビジョンタスクにおいて基本的な要素であるが、高い量的精度と知覚品質の両方を達成することは大きな課題である。
本稿では,人間のエッジ認識における固有非対称性を活用することでこの問題に対処する,Symmetrization Weighted Binary Cross-Entropy (SWBCE)損失関数を提案する。
ラベル誘導学習と予測誘導学習のバランスをとることで、SWBCEは偽陽性を効果的に抑制しつつ高いエッジリコールを維持する。
複数のデータセットおよびベースラインモデルにまたがる広範囲な実験は、先行損失関数との比較とともに、我々の手法がED結果の量的指標と知覚的品質の両方を一貫して改善することを実証している。
これらの結果は、高品質エッジ予測におけるSWBCEの有効性と、関連する視覚タスクへの適用可能性を示している。
関連論文リスト
- Review, Refine, Repeat: Understanding Iterative Decoding of AI Agents with Dynamic Evaluation and Selection [71.92083784393418]
Best-of-N (BON) サンプリングのような推論時間法は、パフォーマンスを改善するための単純で効果的な代替手段を提供する。
本稿では,反復的改良と動的候補評価,検証器による選択を併用した反復的エージェント復号(IAD)を提案する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - Pixel-Wise Feature Selection for Perceptual Edge Detection without post-processing [0.0]
本稿では,既存EDモデルにシームレスに統合可能なディープネットワークのための新しい特徴選択パラダイムを提案する。
この追加構造を取り入れることで、従来のEDモデルの性能は後処理なしで大幅に向上し、同時に予測の知覚品質も向上する。
論文 参考訳(メタデータ) (2025-01-05T13:28:37Z) - UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation [93.38604803625294]
IncertaintyRAG, a novel approach for long-context Retrieval-Augmented Generation (RAG)について紹介する。
我々は、SNR(Signal-to-Noise Ratio)ベースのスパン不確実性を用いて、テキストチャンク間の類似性を推定する。
不確かさRAGはLLaMA-2-7Bでベースラインを2.03%上回り、最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-03T17:39:38Z) - A Simple and Generalist Approach for Panoptic Segmentation [57.94892855772925]
汎用的なビジョンモデルは、様々なビジョンタスクのための1つの同じアーキテクチャを目指している。
このような共有アーキテクチャは魅力的に思えるかもしれないが、ジェネラリストモデルは、その好奇心に満ちたモデルよりも優れている傾向にある。
一般モデルの望ましい性質を損なうことなく、2つの重要なコントリビューションを導入することでこの問題に対処する。
論文 参考訳(メタデータ) (2024-08-29T13:02:12Z) - Zero-Shot Embeddings Inform Learning and Forgetting with Vision-Language Encoders [6.7181844004432385]
IMM(Inter-Intra Modal Measure)は、微調整によるパフォーマンス変化の強力な予測器として機能する。
IIMMスコアの高いタスクの微調整はドメイン内のパフォーマンス向上をもたらすが、ドメイン外のパフォーマンス低下も引き起こす。
ターゲットデータの1つのフォワードパスだけで、実践者は、この重要な洞察を利用して、モデルが微調整後の改善を期待できる程度を評価することができる。
論文 参考訳(メタデータ) (2024-07-22T15:35:09Z) - Uncertainty Quantification for Bird's Eye View Semantic Segmentation: Methods and Benchmarks [10.193504550494486]
本稿では,BEVセグメンテーションにおける予測不確実性定量化のためのベンチマークを提案する。
誤分類および非分布画素の識別における予測不確実性の有効性と校正に焦点が当てられている。
本研究では,不均衡なデータに対する不確実性-局所-クロス-エントロピー損失を提案し,セグメンテーションの品質とキャリブレーションを継続的に改善する。
論文 参考訳(メタデータ) (2024-05-31T16:32:46Z) - HANet: A Hierarchical Attention Network for Change Detection With Bitemporal Very-High-Resolution Remote Sensing Images [6.890268321645873]
本研究では,変化情報の追加を含まないことに基づく,段階的前景バランスサンプリング戦略を提案する。
この戦略は、初期のトレーニングプロセス中に変更したピクセルの特徴を正確に学習するのに役立つ。
また,階層型注意ネットワーク(HANet)を設計し,マルチスケール機能の統合と詳細機能の改良を図る。
論文 参考訳(メタデータ) (2024-04-14T08:01:27Z) - Produce Once, Utilize Twice for Anomaly Detection [6.501323305130114]
我々は、再構成ネットワークにおける識別情報電位を再利用することにより、精度と効率を両立させるPOUTAを導出する。
POUTAは、特別な設計をせずに、最先端の数発の異常検出方法よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2023-12-20T10:49:49Z) - Revisiting Cephalometric Landmark Detection from the view of Human Pose
Estimation with Lightweight Super-Resolution Head [11.40242574405714]
提案手法は,MMPose として知られるヒューマノイドポーズ推定(HPE)に基づくベンチマークである。
パフォーマンスをさらに向上するために、フレームワーク内にアップスケーリング設計を導入します。
MICCAI CLDetection2023では,3つの指標で1位,残る1つで3位となった。
論文 参考訳(メタデータ) (2023-09-29T11:15:39Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - EEG-Inception: An Accurate and Robust End-to-End Neural Network for
EEG-based Motor Imagery Classification [123.93460670568554]
本稿では,脳波に基づく運動画像(MI)分類のための新しい畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
提案したCNNモデル、すなわちEEG-Inceptionは、Inception-Timeネットワークのバックボーン上に構築されている。
提案するネットワークは、生のEEG信号を入力とし、複雑なEEG信号前処理を必要としないため、エンドツーエンドの分類である。
論文 参考訳(メタデータ) (2021-01-24T19:03:10Z) - Uncertainty-Aware Deep Calibrated Salient Object Detection [74.58153220370527]
既存のディープニューラルネットワークに基づくサルエントオブジェクト検出(SOD)手法は主に高いネットワーク精度の追求に重点を置いている。
これらの手法は、信頼不均衡問題として知られるネットワーク精度と予測信頼の間のギャップを見落としている。
我々は,不確実性を考慮した深部SODネットワークを導入し,深部SODネットワークの過信を防止するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2020-12-10T23:28:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。