論文の概要: Aligning Object Detector Bounding Boxes with Human Preference
- arxiv url: http://arxiv.org/abs/2408.10844v1
- Date: Tue, 20 Aug 2024 13:37:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-21 13:35:12.696137
- Title: Aligning Object Detector Bounding Boxes with Human Preference
- Title(参考訳): 人選好による物体検出器境界ボックスの調整
- Authors: Ombretta Strafforello, Osman S. Kayhan, Oana Inel, Klamer Schutte, Jan van Gemert,
- Abstract要約: 一般的に使われている物体検出器は、大小の箱を等しく予測する。
定性的評価は、人間の嗜好が物体の形状のようないくつかの物体の特徴に影響される可能性があることを示している。
- 参考スコア(独自算出の注目度): 7.905665188814953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Previous work shows that humans tend to prefer large bounding boxes over small bounding boxes with the same IoU. However, we show here that commonly used object detectors predict large and small boxes equally often. In this work, we investigate how to align automatically detected object boxes with human preference and study whether this improves human quality perception. We evaluate the performance of three commonly used object detectors through a user study (N = 123). We find that humans prefer object detections that are upscaled with factors of 1.5 or 2, even if the corresponding AP is close to 0. Motivated by this result, we propose an asymmetric bounding box regression loss that encourages large over small predicted bounding boxes. Our evaluation study shows that object detectors fine-tuned with the asymmetric loss are better aligned with human preference and are preferred over fixed scaling factors. A qualitative evaluation shows that human preference might be influenced by some object characteristics, like object shape.
- Abstract(参考訳): 以前の研究では、人間は同じIoUを持つ小さな境界ボックスよりも大きな境界ボックスを好む傾向が示されていた。
しかし、ここでは、一般的に使われている物体検出器が、大小の箱を等しく予測していることが示されている。
本研究では,自動検出対象箱を人間の嗜好と整合させる方法について検討し,それが人間の品質知覚に及ぼす影響について検討する。
我々は,3つの一般的な物体検出器の性能をユーザスタディ(N = 123)により評価した。
人間は、対応するAPが0に近くても、1.5または2の因子でスケールアップされた物体検出を好む。
この結果により、予測される小さな有界箱よりも大きい非対称な有界箱回帰損失を提案する。
評価の結果,非対称な損失で微調整された物体検出器は,人間の嗜好に適合し,一定のスケーリング因子よりも好まれることがわかった。
定性的評価は、人間の嗜好が物体の形状のようないくつかの物体の特徴に影響される可能性があることを示している。
関連論文リスト
- Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection [133.66006666465447]
現在のメトリクスはサイズに敏感で、大きなオブジェクトが集中し、小さなオブジェクトが無視される傾向があります。
サイズに基づくバイアスは、追加のセマンティック情報なしでは不適切であるため、評価はサイズ不変であるべきだと論じる。
我々は,この目標に適した最適化フレームワークを開発し,異なる大きさのオブジェクトの検出において,大幅な改善を実現した。
論文 参考訳(メタデータ) (2024-05-16T03:01:06Z) - Bounding Box Stability against Feature Dropout Reflects Detector Generalization across Environments [52.65013932553849]
良い検出器は、位置があまり変化しない有界箱を出力する傾向があり、弱い検出器の有界箱は顕著な位置変化を受ける。
ボックス安定性スコア(BoSスコア)を計算して、この安定性を反映する。
各種試験環境における平均平均精度(mAP)を用いて測定した検出精度とBoSスコアが強い正の相関関係を持つことに寄与する。
論文 参考訳(メタデータ) (2024-03-20T17:59:16Z) - SAILOR: Scaling Anchors via Insights into Latent Object Representation [5.96002531660335]
LiDARの3Dオブジェクト検出モデルは、必然的にトレーニングデータセットに偏っている。
オブジェクトのサイズは、例えば、異なるラベル付けポリシーや地理的位置のために、ドメイン間で大きく異なります。
オブジェクトサイズバイアスを克服するアンカーキャリブレーション手法を提案する。
論文 参考訳(メタデータ) (2022-10-14T13:40:46Z) - A Large-scale Multiple-objective Method for Black-box Attack against
Object Detection [70.00150794625053]
我々は、真正の確率を最小化し、偽正の確率を最大化し、より多くの偽正の物体が新しい真正の有界箱を作らないようにする。
我々は、GARSDCと呼ばれるランダム・サブセット選択とディバイド・アンド・コンカーによる標準的な遺伝的アルゴリズムを拡張し、効率を大幅に改善する。
最先端攻撃法と比較して、GARSDCはmAPでは平均12.0、広範囲な実験ではクエリでは約1000倍減少する。
論文 参考訳(メタデータ) (2022-09-16T08:36:42Z) - Robust Object Detection With Inaccurate Bounding Boxes [27.664730859319707]
正確なオブジェクト検出器を学習するには、しばしば、正確なオブジェクト境界ボックスを持つ大規模なトレーニングデータが必要である。
本研究では,不正確なバウンディングボックスを用いた頑健な物体検出器の学習という課題に対処することを目的とする。
オブジェクトをインスタンスの袋として扱うことで、私たちはObject-Aware Multiple Instance Learningアプローチを導入します。
論文 参考訳(メタデータ) (2022-07-20T06:57:30Z) - Decoupled Adaptation for Cross-Domain Object Detection [69.5852335091519]
クロスドメインオブジェクト検出は、オブジェクト分類よりも難しい。
D-adaptは4つのクロスドメインオブジェクト検出タスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-10-06T08:43:59Z) - DAFNe: A One-Stage Anchor-Free Deep Model for Oriented Object Detection [16.21161769128316]
DAFNe: オブジェクト指向物体検出のためのワンステージアンカーフリーディープネットワークを提案する。
アンカーフリーモデルとして、DAFNeはバウンディングボックスアンカーの使用を控えることで予測複雑性を低減する。
低品質な予測に対する任意指向の有界箱に対する中心性関数の指向性を考慮した一般化を提案する。
論文 参考訳(メタデータ) (2021-09-13T17:37:20Z) - Human Object Interaction Detection using Two-Direction Spatial
Enhancement and Exclusive Object Prior [28.99655101929647]
Human-Object Interaction (HOI) 検出は、画像中の人間とオブジェクトの視覚的関係を検出することを目的とする。
非インタラクティブな人-物対は、容易に誤分類され、アクションとして分類される。
本論文では, 空間的制約を2方向から強化する空間拡張手法を提案する。
論文 参考訳(メタデータ) (2021-05-07T07:18:27Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。