論文の概要: On the Robustness of Human-Object Interaction Detection against Distribution Shift
- arxiv url: http://arxiv.org/abs/2506.18021v1
- Date: Sun, 22 Jun 2025 13:01:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.702609
- Title: On the Robustness of Human-Object Interaction Detection against Distribution Shift
- Title(参考訳): 分布シフトに対する人間と物体の相互作用検出のロバスト性について
- Authors: Chi Xie, Shuang Liang, Jie Li, Feng Zhu, Rui Zhao, Yichen Wei, Shengjie Zhao,
- Abstract要約: 近年,Human-Object Interaction (HOI) 検出が大幅に進歩している。
既存の作業は、必然的な分布シフトを伴う現実的なシナリオとはかけ離れた、理想的なイメージと自然な分布を持つ標準設定に重点を置いている。
本研究では,様々な分布シフト下でのHOI検出モデルのロバスト性をベンチマークし,解析し,向上させることにより,この問題を考察する。
- 参考スコア(独自算出の注目度): 27.40641711088878
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Human-Object Interaction (HOI) detection has seen substantial advances in recent years. However, existing works focus on the standard setting with ideal images and natural distribution, far from practical scenarios with inevitable distribution shifts. This hampers the practical applicability of HOI detection. In this work, we investigate this issue by benchmarking, analyzing, and enhancing the robustness of HOI detection models under various distribution shifts. We start by proposing a novel automated approach to create the first robustness evaluation benchmark for HOI detection. Subsequently, we evaluate more than 40 existing HOI detection models on this benchmark, showing their insufficiency, analyzing the features of different frameworks, and discussing how the robustness in HOI is different from other tasks. With the insights from such analyses, we propose to improve the robustness of HOI detection methods through: (1) a cross-domain data augmentation integrated with mixup, and (2) a feature fusion strategy with frozen vision foundation models. Both are simple, plug-and-play, and applicable to various methods. Our experimental results demonstrate that the proposed approach significantly increases the robustness of various methods, with benefits on standard benchmarks, too. The dataset and code will be released.
- Abstract(参考訳): 近年,Human-Object Interaction (HOI) 検出が大幅に進歩している。
しかし、既存の研究は、必然的な分布シフトを伴う現実的なシナリオとはかけ離れた、理想的な画像と自然分布の標準設定に焦点を当てている。
これにより、HOI検出の実用性が損なわれる。
本研究では,様々な分布シフト下でのHOI検出モデルのロバスト性をベンチマークし,解析し,向上させることにより,この問題を考察する。
まず、HOI検出のための最初のロバストネス評価ベンチマークを作成するために、新しい自動化アプローチを提案する。
その後、このベンチマークで40以上の既存のHOI検出モデルを評価し、その不十分さを示し、異なるフレームワークの特徴を分析し、HOIの堅牢性は他のタスクとどのように異なるかについて議論した。
このような分析から得られた知見をもとに,(1)混合アップと統合されたドメイン間データ拡張,(2)凍結視覚基盤モデルによる特徴融合戦略によるHOI検出手法の堅牢性の向上を提案する。
どちらもシンプルで、プラグアンドプレイで、様々な方法に適用できる。
実験の結果,提案手法は各種手法のロバスト性を大幅に向上させ,標準ベンチマークにも有効であることがわかった。
データセットとコードがリリースされる。
関連論文リスト
- Out-of-Distribution Detection on Graphs: A Survey [58.47395497985277]
グラフアウト・オブ・ディストリビューション(GOOD)検出は、トレーニング中に見られる分布から逸脱するグラフデータを特定することに焦点を当てる。
既存の手法を,拡張ベース,再構築ベース,情報伝達ベース,分類ベースという4つのタイプに分類する。
本稿では,グラフデータによるユニークな課題を浮き彫りにして,実践的応用と理論的基礎について論じる。
論文 参考訳(メタデータ) (2025-02-12T04:07:12Z) - Dissecting Out-of-Distribution Detection and Open-Set Recognition: A Critical Analysis of Methods and Benchmarks [17.520137576423593]
我々は,コミュニティ内の2つの大きなサブフィールドの総合的なビュー – アウト・オブ・ディストリビューション(OOD)検出とオープンセット認識(OSR) – を提供することを目指している。
我々は,OOD検出における最先端手法とOSR設定との厳密な相互評価を行い,それらの手法の性能の強い相関関係を同定する。
我々は,OOD検出とOSRによって取り組まれている問題を解消する,より大規模なベンチマーク設定を提案する。
論文 参考訳(メタデータ) (2024-08-29T17:55:07Z) - Combine and Conquer: A Meta-Analysis on Data Shift and Out-of-Distribution Detection [30.377446496559635]
本稿では,アウト・オブ・ディストリビューション(OOD)検出スコアをシームレスに組み合わせるための普遍的アプローチを提案する。
我々のフレームワークは、検出スコアにおける将来の発展にとって容易であり、この文脈で意思決定境界を結合する最初の手段である。
論文 参考訳(メタデータ) (2024-06-23T08:16:44Z) - Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。
この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。
セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文 参考訳(メタデータ) (2024-04-16T17:38:26Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Open World Object Detection in the Era of Foundation Models [53.683963161370585]
5つの実世界のアプリケーション駆動データセットを含む新しいベンチマークを導入する。
本稿では,オープンワールドのための新しいオブジェクト検出モデル(FOMO)を提案する。
論文 参考訳(メタデータ) (2023-12-10T03:56:06Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Boosting Out-of-Distribution Detection with Multiple Pre-trained Models [41.66566916581451]
事前訓練されたモデルを用いたポストホック検出は有望な性能を示し、大規模にスケールできる。
本稿では,事前訓練されたモデルの動物園から抽出した複数の検出決定をアンサンブルすることで,検出強化手法を提案する。
CIFAR10 と ImageNet のベンチマークでは, 相対性能を 65.40% と 26.96% で大幅に改善した。
論文 参考訳(メタデータ) (2022-12-24T12:11:38Z) - CD-FSOD: A Benchmark for Cross-domain Few-shot Object Detection [0.0]
我々は、メタラーニングのFSODアプローチや微調整のFSODアプローチなど、最先端のFSODアプローチを評価する。
私たちのアプローチは、大きなマージンで既存のアプローチよりもはるかに優れている。
論文 参考訳(メタデータ) (2022-10-11T10:10:07Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。