論文の概要: Towards Size-invariant Salient Object Detection: A Generic Evaluation and Optimization Approach
- arxiv url: http://arxiv.org/abs/2509.15573v2
- Date: Fri, 03 Oct 2025 01:55:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 14:21:29.876202
- Title: Towards Size-invariant Salient Object Detection: A Generic Evaluation and Optimization Approach
- Title(参考訳): サイズ不変な有意物体検出に向けて:ジェネリック評価と最適化アプローチ
- Authors: Shilong Bao, Qianqian Xu, Feiran Li, Boyu Han, Zhiyong Yang, Xiaochun Cao, Qingming Huang,
- Abstract要約: 本稿では,既存の広範に使用されているSalient Object Detectionメトリクスの固有サイズ感度を明らかにするために,新しい視点を示す。
この課題に対処するため、汎用的なサイズ不変評価(SIEva)フレームワークが提案されている。
さらに、サイズ不変の原理に固執する専用最適化フレームワーク(SIOpt)を開発し、幅広いサイズにわたる有能な物体の検出を大幅に強化する。
- 参考スコア(独自算出の注目度): 118.75896764188424
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates a fundamental yet underexplored issue in Salient Object Detection (SOD): the size-invariant property for evaluation protocols, particularly in scenarios when multiple salient objects of significantly different sizes appear within a single image. We first present a novel perspective to expose the inherent size sensitivity of existing widely used SOD metrics. Through careful theoretical derivations, we show that the evaluation outcome of an image under current SOD metrics can be essentially decomposed into a sum of several separable terms, with the contribution of each term being directly proportional to its corresponding region size. Consequently, the prediction errors would be dominated by the larger regions, while smaller yet potentially more semantically important objects are often overlooked, leading to biased performance assessments and practical degradation. To address this challenge, a generic Size-Invariant Evaluation (SIEva) framework is proposed. The core idea is to evaluate each separable component individually and then aggregate the results, thereby effectively mitigating the impact of size imbalance across objects. Building upon this, we further develop a dedicated optimization framework (SIOpt), which adheres to the size-invariant principle and significantly enhances the detection of salient objects across a broad range of sizes. Notably, SIOpt is model-agnostic and can be seamlessly integrated with a wide range of SOD backbones. Theoretically, we also present generalization analysis of SOD methods and provide evidence supporting the validity of our new evaluation protocols. Finally, comprehensive experiments speak to the efficacy of our proposed approach. The code is available at https://github.com/Ferry-Li/SI-SOD.
- Abstract(参考訳): 本稿では、評価プロトコルにおけるサイズ不変性、特に1つの画像に大きく異なる大きさの複数のサルエントオブジェクトが現れるシナリオにおける、SOD(Salient Object Detection)の根本的な課題について検討する。
まず、既存の広く使われているSODメトリクスの固有サイズ感度を明らかにするために、新しい視点を提示する。
慎重に理論的導出を行うことにより、現在のSOD測定値に基づく画像の評価結果を、各項の寄与が対応する領域サイズに直接比例して、本質的に複数の分離項の和に分解できることが示される。
その結果、予測エラーはより大きな領域に支配されるが、より小さく、より意味的に重要なオブジェクトはしばしば見過ごされ、性能評価のバイアスと実用的な劣化につながる。
この課題に対処するため、汎用的なサイズ不変評価(SIEva)フレームワークが提案されている。
中心となる考え方は、各分離可能なコンポーネントを個別に評価し、その結果を集約することで、オブジェクト間のサイズ不均衡の影響を効果的に軽減することである。
これに基づいて、我々は、サイズ不変の原則に準拠した専用最適化フレームワーク(SIOpt)を更に開発し、幅広いサイズにわたる有能な物体の検出を大幅に強化する。
特に、SIOptはモデルに依存しないため、広範囲のSODバックボーンとシームレスに統合することができる。
理論的には、SOD法の一般化分析や、新しい評価プロトコルの有効性を裏付ける証拠も提示する。
最後に,提案手法の有効性について総合実験を行った。
コードはhttps://github.com/Ferry-Li/SI-SOD.comで公開されている。
関連論文リスト
- A Unifying Information-theoretic Perspective on Evaluating Generative Models [5.524685807042777]
最近のいくつかのアプローチでは、分類領域から借用された「精度」と「リコール」を利用して、出力の忠実度(リアリズム)と出力の多様性(実データ変動の表現)を個別に定量化している。
我々は、kNN密度推定のアプローチを用いて、kth-nearest-neighbors(kNN)ベースのメトリクスのクラスを情報理論レンズの下に統一する。
高精度クロスエントロピー(PCE)、リコールクロスエントロピー(RCE)、リコールエントロピー(RE)からなる3次元計量を提案する。
論文 参考訳(メタデータ) (2024-12-18T21:17:02Z) - Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection [133.66006666465447]
現在のメトリクスはサイズに敏感で、大きなオブジェクトが集中し、小さなオブジェクトが無視される傾向があります。
サイズに基づくバイアスは、追加のセマンティック情報なしでは不適切であるため、評価はサイズ不変であるべきだと論じる。
我々は,この目標に適した最適化フレームワークを開発し,異なる大きさのオブジェクトの検出において,大幅な改善を実現した。
論文 参考訳(メタデータ) (2024-05-16T03:01:06Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Intrinsic Dimensionality Estimation within Tight Localities: A
Theoretical and Experimental Analysis [0.0]
そこで本研究では,20個のサンプル点からなるタイトな局所性に対しても安定な局所ID推定手法を提案する。
実験結果から,提案手法の偏差は比較的小さいが, 偏差は比較的小さく, 試料径は最先端の推定値よりもはるかに小さいことがわかった。
論文 参考訳(メタデータ) (2022-09-29T00:00:11Z) - Generalised Co-Salient Object Detection [50.876864826216924]
本稿では,従来のCo-Salient Object Detection(CoSOD)設定における仮定を緩和する新しい設定を提案する。
我々はこの新たな設定を一般共分散オブジェクト検出(GCoSOD)と呼ぶ。
本稿では,コサリエントオブジェクトのイメージ間欠如の認識をCoSODモデルに再現する,新しいランダムサンプリングに基づく一般CoSODトレーニング(Generalized CoSOD Training, GCT)手法を提案する。
論文 参考訳(メタデータ) (2022-08-20T12:23:32Z) - TISE: A Toolbox for Text-to-Image Synthesis Evaluation [9.092600296992925]
単目的と多目的のテキスト・ツー・イメージ合成のための最先端手法の研究を行う。
これらの手法を評価するための共通フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-02T16:39:35Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。