論文の概要: Corner Cases: How Size and Position of Objects Challenge ImageNet-Trained Models
- arxiv url: http://arxiv.org/abs/2505.03569v1
- Date: Tue, 06 May 2025 14:27:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-07 18:50:11.425123
- Title: Corner Cases: How Size and Position of Objects Challenge ImageNet-Trained Models
- Title(参考訳): コーナーケース:物体のサイズと位置が、画像ネット訓練モデルにどのように挑戦するか
- Authors: Mishal Fatima, Steffen Jung, Margret Keuper,
- Abstract要約: 画像の背景は、異なるデータポイント間の刺激的な相関に寄与する主要な役割を担っている。
本稿では,これらのバイアスが,モデルが背景の刺激的特徴にどの程度依存しているかに影響を与え,その予測に影響を及ぼすことを示す。
- 参考スコア(独自算出の注目度): 17.331413720045898
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Backgrounds in images play a major role in contributing to spurious correlations among different data points. Owing to aesthetic preferences of humans capturing the images, datasets can exhibit positional (location of the object within a given frame) and size (region-of-interest to image ratio) biases for different classes. In this paper, we show that these biases can impact how much a model relies on spurious features in the background to make its predictions. To better illustrate our findings, we propose a synthetic dataset derived from ImageNet1k, Hard-Spurious-ImageNet, which contains images with various backgrounds, object positions, and object sizes. By evaluating the dataset on different pretrained models, we find that most models rely heavily on spurious features in the background when the region-of-interest (ROI) to image ratio is small and the object is far from the center of the image. Moreover, we also show that current methods that aim to mitigate harmful spurious features, do not take into account these factors, hence fail to achieve considerable performance gains for worst-group accuracies when the size and location of core features in an image change.
- Abstract(参考訳): 画像の背景は、異なるデータポイント間の刺激的な相関に寄与する主要な役割を担っている。
画像を取得する人間の美的嗜好のために、データセットは、異なるクラスに対して位置(特定のフレーム内の物体の位置)とサイズ(画像比に対する関心の領域)のバイアスを示すことができる。
本稿では,これらのバイアスが,モデルが背景の刺激的特徴にどの程度依存しているかに影響を与え,その予測に影響を及ぼすことを示す。
そこで本研究では,背景,物体位置,物体の大きさの異なる画像を含むImageNet1k,Hard-Spurious-ImageNetの合成データセットを提案する。
異なる事前学習モデルを用いてデータセットを評価することにより、ほとんどのモデルは、画像の領域(ROI)が小さく、物体が画像の中心から遠く離れている場合に、背景にある刺激的な特徴に大きく依存していることが分かる。
また, 有害な突発的特徴を緩和する現在の手法では, これらの要因を考慮せず, 画像変化におけるコア特徴のサイズや位置が変化しても, 最悪のグループアキュラシーにおいて, 大幅な性能向上を達成できないことを示す。
関連論文リスト
- Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - DisPositioNet: Disentangled Pose and Identity in Semantic Image
Manipulation [83.51882381294357]
DisPositioNetは、シーングラフを用いた画像操作のタスクに対して、各オブジェクトのアンタングル表現を学習するモデルである。
我々のフレームワークは、グラフ内の特徴表現と同様に、変分潜在埋め込みの切り離しを可能にする。
論文 参考訳(メタデータ) (2022-11-10T11:47:37Z) - ARUBA: An Architecture-Agnostic Balanced Loss for Aerial Object
Detection [24.085715205081385]
我々は、オブジェクトのサイズを画像中の画素数、サイズ不均衡として、データセット内の特定のサイズのオブジェクトの過剰表現として表現する。
本稿では,任意のオブジェクト検出モデル上にプラグインとして適用可能な,新しいARchitectUre-Agnostic BAlanced Loss (ARUBA)を提案する。
論文 参考訳(メタデータ) (2022-10-10T11:28:16Z) - Vision Models Are More Robust And Fair When Pretrained On Uncurated
Images Without Supervision [38.22842778742829]
差別的な自己教師型学習は、インターネット画像の任意のランダムなグループでのトレーニングモデルを可能にする。
データ前処理や事前の仮定なしで、何十億ものランダムなイメージでモデルをトレーニングします。
フェアネス、分布シフト、地理的多様性、微粒化認識、画像コピー検出、および多くの画像分類データセットを含む50以上のベンチマークにおいて、我々のモデル性能を広範囲に研究し、検証した。
論文 参考訳(メタデータ) (2022-02-16T22:26:47Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - SI-Score: An image dataset for fine-grained analysis of robustness to
object location, rotation and size [95.00667357120442]
オブジェクトの位置、回転、サイズを変えることは、非自明な方法で予測に影響を与える可能性がある。
合成データセットであるSI-Scoreを用いて,これらの変動要因に対するロバストネスのきめ細かい解析を行う。
論文 参考訳(メタデータ) (2021-04-09T05:00:49Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - Rethinking Natural Adversarial Examples for Classification Models [43.87819913022369]
ImageNet-Aは、自然対比例の有名なデータセットです。
オブジェクト検出技術を用いたImageNet-A例の背景影響を低減して仮説を検証した。
実験により,様々な分類モデルを用いた物体検出モデルは,その分類モデルよりも精度が高かった。
論文 参考訳(メタデータ) (2021-02-23T14:46:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。