論文の概要: Seeing Beyond the Scene: Analyzing and Mitigating Background Bias in Action Recognition
- arxiv url: http://arxiv.org/abs/2512.17953v1
- Date: Wed, 17 Dec 2025 08:54:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.120113
- Title: Seeing Beyond the Scene: Analyzing and Mitigating Background Bias in Action Recognition
- Title(参考訳): 場面を超えて見る:行動認識における背景バイアスの分析と緩和
- Authors: Ellie Zhou, Jihoon Chung, Olga Russakovsky,
- Abstract要約: 本稿では,行動認識モデル間の背景バイアスの系統的解析を行う。
いずれも,背景推論に対するデフォルトの傾向が強いことが分かりました。
分類モデルの緩和戦略を提案し、セグメント化された人間の入力を組み込むことで、背景バイアスを3.78%減らすことを示す。
- 参考スコア(独自算出の注目度): 23.163353076715214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human action recognition models often rely on background cues rather than human movement and pose to make predictions, a behavior known as background bias. We present a systematic analysis of background bias across classification models, contrastive text-image pretrained models, and Video Large Language Models (VLLM) and find that all exhibit a strong tendency to default to background reasoning. Next, we propose mitigation strategies for classification models and show that incorporating segmented human input effectively decreases background bias by 3.78%. Finally, we explore manual and automated prompt tuning for VLLMs, demonstrating that prompt design can steer predictions towards human-focused reasoning by 9.85%.
- Abstract(参考訳): 人間の行動認識モデルは、人間の動きよりも背景の手がかりに頼り、背景バイアスと呼ばれる行動の予測を行う。
本稿では、分類モデル、コントラストテキスト画像事前学習モデル、ビデオ大言語モデル(VLLM)の背景バイアスの体系的解析を行い、背景推論に対するデフォルト傾向を示すことを示す。
次に、分類モデルの緩和戦略を提案し、セグメント化された人間の入力を組み込むことで、背景バイアスを3.78%減らすことを示す。
最後に、VLLMのマニュアルおよび自動プロンプトチューニングについて検討し、プロンプト設計が人間中心の推論を9.85%推し進めることを示す。
関連論文リスト
- Exploring Bias in over 100 Text-to-Image Generative Models [49.60774626839712]
本稿では,Hugging Faceのようなオープンプラットフォームによるモデルの利用率向上に着目し,テキストから画像への生成モデルにおけるバイアスの傾向について検討する。
我々は, (i) 分布バイアス, (ii) 生成幻覚, (iii) 生成ミスレートの3つの主要な次元にまたがるバイアスを評価する。
以上の結果から, 芸術的モデルとスタイル変換モデルに有意なバイアスが生じる一方で, より広範なトレーニング分布の恩恵を受ける基礎モデルでは, 徐々にバイアスが減っていることが示唆された。
論文 参考訳(メタデータ) (2025-03-11T03:40:44Z) - ALBAR: Adversarial Learning approach to mitigate Biases in Action Recognition [52.537021302246664]
行動認識モデルは、しばしば背景バイアス(背景の手がかりに基づく行動の推測)と前景バイアス(主題の外観に依存する)に悩まされる。
本稿では,前景や背景のバイアスを,バイアス特性の専門知識を必要とせずに軽減する,新たな対人訓練手法であるALBARを提案する。
我々は,提案手法を確立された背景と前景のバイアスプロトコル上で評価し,新しい最先端のバイアスプロトコルを設定し,HMDB51では12%以上のデバイアス性能を向上した。
論文 参考訳(メタデータ) (2025-01-31T20:47:06Z) - CLAD: A Contrastive Learning based Approach for Background Debiasing [43.0296255565593]
我々は,CNNにおける背景バイアスを軽減するために,対照的な学習に基づくアプローチを導入する。
前回のベンチマークを4.1%で上回り、バックグラウンドチャレンジデータセットで最先端の結果を得た。
論文 参考訳(メタデータ) (2022-10-06T08:33:23Z) - DASH: Visual Analytics for Debiasing Image Classification via
User-Driven Synthetic Data Augmentation [27.780618650580923]
画像分類モデルは、訓練データにおいて、入力特徴と出力クラスとの間の無関係な共起に基づいてクラスを予測することをしばしば学習する。
我々は、望ましくない相関を「データバイアス」と呼び、データバイアスを引き起こす視覚的特徴を「バイアス要因」と呼んでいる。
人間の介入なしにバイアスを自動的に識別し緩和することは困難である。
論文 参考訳(メタデータ) (2022-09-14T00:44:41Z) - Myope Models -- Are face presentation attack detection models
short-sighted? [3.4376560669160394]
プレゼンテーション攻撃は生体認証システムへの繰り返しの脅威であり、インポスタはこれらのシステムをバイパスしようとする。
本研究は,作物と無作為の顔提示攻撃検出(PAD)モデルの比較研究である。
その結果,画像に背景が存在する場合,その性能は一貫して良好であることがわかった。
論文 参考訳(メタデータ) (2021-11-22T11:28:44Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Unravelling the Effect of Image Distortions for Biased Prediction of
Pre-trained Face Recognition Models [86.79402670904338]
画像歪みの存在下での4つの最先端深層顔認識モデルの性能評価を行った。
我々は、画像歪みが、異なるサブグループ間でのモデルの性能ギャップと関係していることを観察した。
論文 参考訳(メタデータ) (2021-08-14T16:49:05Z) - Noise or Signal: The Role of Image Backgrounds in Object Recognition [93.55720207356603]
我々は、ImageNetイメージ上の前景と背景信号をアンタングリングするためのツールキットを作成する。
a)モデルが背景のみに依存して非自明な精度が得られること、(b)モデルが正しく分類された前景が存在する場合でも、しばしば画像の分類を誤っていること、が分かる。
論文 参考訳(メタデータ) (2020-06-17T16:54:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。