論文の概要: No More Sibling Rivalry: Debiasing Human-Object Interaction Detection
- arxiv url: http://arxiv.org/abs/2509.00760v1
- Date: Sun, 31 Aug 2025 09:23:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.379474
- Title: No More Sibling Rivalry: Debiasing Human-Object Interaction Detection
- Title(参考訳): 兄弟姉妹がいない:人間と物体の相互作用を検出するのを嫌う
- Authors: Bin Yang, Yulin Zhang, Hong-Yu Zhou, Sibei Yang,
- Abstract要約: この研究は、相互作用デコーダの学習を妨げる重要な問題である「毒性兄弟」のバイアスを特定する。
このバイアスは、兄弟三重項/カテゴリ間の高い混乱から生じ、類似性の増加はパラドックス的に精度を低下させる。
我々は,2つの新しいデバイアス学習目標-「コントラスト-then-calibration」と「マージ-then-split」を提案する。
- 参考スコア(独自算出の注目度): 47.554732714656296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detection transformers have been applied to human-object interaction (HOI) detection, enhancing the localization and recognition of human-action-object triplets in images. Despite remarkable progress, this study identifies a critical issue-"Toxic Siblings" bias-which hinders the interaction decoder's learning, as numerous similar yet distinct HOI triplets interfere with and even compete against each other both input side and output side to the interaction decoder. This bias arises from high confusion among sibling triplets/categories, where increased similarity paradoxically reduces precision, as one's gain comes at the expense of its toxic sibling's decline. To address this, we propose two novel debiasing learning objectives-"contrastive-then-calibration" and "merge-then-split"-targeting the input and output perspectives, respectively. The former samples sibling-like incorrect HOI triplets and reconstructs them into correct ones, guided by strong positional priors. The latter first learns shared features among sibling categories to distinguish them from other groups, then explicitly refines intra-group differentiation to preserve uniqueness. Experiments show that we significantly outperform both the baseline (+9.18% mAP on HICO-Det) and the state-of-the-art (+3.59% mAP) across various settings.
- Abstract(参考訳): 画像中の人-物間相互作用(HOI)の検出や、人-物-物三重項の局所化と認識の促進に、検出トランスフォーマーが応用されている。
顕著な進歩にもかかわらず、本研究では、相互作用デコーダの学習を妨げる重要な問題である「毒性兄弟」のバイアスを特定し、多くの類似したHOI三重項が相互作用デコーダの入力側と出力側の両方に干渉し、競合する。
このバイアスは、兄弟姉妹間の高い混乱から生じるもので、類似性の増加は、毒性を持つ兄弟姉妹の減少を犠牲にして得られるため、パラドックス的に精度を低下させる。
そこで本研究では,それぞれが入力視点と出力視点を目標とする2つの新しいデバイアス学習目標"コントラスト-then-calibration"と"マージ-then-split"を提案する。
前のサンプルは、兄弟のような不正確なHOI三つ子で、それらが正しいものへと再構成され、強力な位置の先行によって導かれる。
後者はまず、他のグループと区別するために兄弟カテゴリー間での共通特徴を学習し、その後、独特性を維持するためにグループ内の分化を明示的に洗練する。
実験の結果,HICO-Detのベースライン (+9.18% mAP) と最先端 (+3.59% mAP) の両方を様々な設定で大幅に上回った。
関連論文リスト
- Mitigate One, Skew Another? Tackling Intersectional Biases in Text-to-Image Models [73.20190633746442]
テキスト・ツー・イメージ・モデルにおけるバイアス相互作用を解析・定量化するための新しいツールであるBiasConnectを紹介する。
ユーザが定義した目標分布と優先度重みを導出する交叉バイアス緩和アルゴリズムであるInterMitを提案する。
論文 参考訳(メタデータ) (2025-05-22T20:56:38Z) - Mitigating Spurious Negative Pairs for Robust Industrial Anomaly Detection [9.93548802132951]
敵攻撃に対する既存の検出手法の堅牢性は依然として課題であり、自律運転のような現実のアプリケーションにおいて信頼性を損なう。
本稿では,ADにおける対人訓練の理想的目的関数として,正規群から派生した擬似奇形群を提案する。
これらの結果から, 突発性負対が従来のコントラスト損失を損なうことにより, 頑健なADを達成できることが示唆された。
論文 参考訳(メタデータ) (2025-01-26T07:32:39Z) - I$^2$MD: 3D Action Representation Learning with Inter- and Intra-modal
Mutual Distillation [147.2183428328396]
一般のモード内相互蒸留(I$2$MD)フレームワークを紹介する。
In 2$MD, we first-formulate the cross-modal interaction as a cross-modal Mutual Distillation (CMD) process。
類似したサンプルの干渉を緩和し,その基盤となるコンテキストを活用するため,モーダル・ミューチュアル蒸留(IMD)戦略をさらに設計する。
論文 参考訳(メタデータ) (2023-10-24T07:22:17Z) - Human-Object Interaction Detection via Disentangled Transformer [63.46358684341105]
本稿では,2つのサブタスクの学習を容易にするために,エンコーダとデコーダの両方をアンタングル化するDisentangled Transformerを提案する。
提案手法は,2つの公開HOIベンチマークにおいて,従来よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2022-04-20T08:15:04Z) - Analyzing and Mitigating Interference in Neural Architecture Search [96.60805562853153]
本研究では、異なる子モデルをサンプリングし、共有演算子の勾配類似度を計算することで干渉問題を解明する。
これら2つの観測から着想を得て、干渉を緩和するための2つのアプローチを提案する。
検索したアーキテクチャは、RoBERTa$_rmbase$が1.1、0.6、ELECTRA$_rmbase$が1.6、テストセットであるGLUEベンチマークで1.1より優れています。
論文 参考訳(メタデータ) (2021-08-29T11:07:46Z) - ICE: Inter-instance Contrastive Encoding for Unsupervised Person
Re-identification [7.766663319126491]
Unsupervised Person Re-identification (ReID) は、アノテーションなしで識別識別機能を学ぶことを目的としている。
従来のクラスレベルの対照的ReIDメソッドを後押しするために、インスタンス間のペアワイズ類似度スコアを利用するInter-instance Contrastive ICEを提案する。
複数の大規模人物ReIDデータセットに対する実験により,提案手法であるICEの有効性が検証された。
論文 参考訳(メタデータ) (2021-03-30T14:05:09Z) - First Target and Opinion then Polarity: Enhancing Target-opinion
Correlation for Aspect Sentiment Triplet Extraction [45.82241446769157]
Aspect Sentiment Triplet Extraction(ASTE)は、ターゲットエンティティ、関連する感情極性、および極性を合理化する意見スパンを含む文からトリプレットを抽出することを目的としています。
既存の方法は、目標対の相関関係の構築に短く、異なる感情三重項間の相互干渉を無視する。
シークエンスタギングによるターゲットと意見の相関性を高める新しい二段階法を提案する。
論文 参考訳(メタデータ) (2021-02-17T03:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。