論文の概要: HICO-DET-SG and V-COCO-SG: New Data Splits for Evaluating the Systematic
Generalization Performance of Human-Object Interaction Detection Models
- arxiv url: http://arxiv.org/abs/2305.09948v4
- Date: Wed, 7 Jun 2023 06:53:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 18:25:18.612196
- Title: HICO-DET-SG and V-COCO-SG: New Data Splits for Evaluating the Systematic
Generalization Performance of Human-Object Interaction Detection Models
- Title(参考訳): HICO-DET-SGとV-COCO-SG:人間-物体相互作用検出モデルの系統的一般化性能評価のための新しいデータ分割
- Authors: Kentaro Takemoto, Moyuru Yamada, Tomotake Sasaki, Hisanao Akima
- Abstract要約: ヒューマン・オブジェクト・インタラクション(Human-Object Interaction、HOI)は、画像中の人間とオブジェクトをローカライズし、人間とオブジェクトのペア間の相互作用を予測するタスクである。
我々の知る限り、HOI検出モデルの系統的一般化性能を評価するためのオープンベンチマークや以前の研究は存在しない。
我々は,HICO-DETデータセットとV-COCOデータセットに基づいて,HICO-DET-SGとV-COCO-SGという2つの新しいHOI検出データ分割を作成した。
- 参考スコア(独自算出の注目度): 2.007262412327553
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human-Object Interaction (HOI) detection is a task to localize humans and
objects in an image and predict the interactions in human-object pairs. In
real-world scenarios, HOI detection models are required systematic
generalization, i.e., generalization to novel combinations of objects and
interactions, because the train data are expected to cover a limited portion of
all possible combinations. However, to our knowledge, no open benchmarks or
previous work exist for evaluating the systematic generalization performance of
HOI detection models. To address this issue, we created two new sets of HOI
detection data splits named HICO-DET-SG and V-COCO-SG based on the HICO-DET and
V-COCO datasets, respectively. When evaluated on the new data splits, the
representative HOI detection models performed much more poorly than when
evaluated on the original splits. This reveals that systematic generalization
is a challenging goal in HOI detection. By analyzing the evaluation results, we
also gain insights for improving the systematic generalization performance and
identify four possible future research directions. We hope that our new data
splits and presented analysis will encourage further research on systematic
generalization in HOI detection.
- Abstract(参考訳): ヒューマン・オブジェクト・インタラクション(human-object interaction、hoi)は、画像内の人間とオブジェクトをローカライズし、人間とオブジェクトのペアで相互作用を予測するタスクである。
実世界のシナリオでは、列車データは可能なすべての組み合わせの限られた部分をカバーすることが期待されるため、hoi検出モデルは体系的な一般化、すなわち、オブジェクトとインタラクションの新しい組み合わせへの一般化が必要である。
しかし、我々の知る限り、HOI検出モデルの系統的一般化性能を評価するためのオープンベンチマークや以前の研究は存在しない。
そこで我々は,HICO-DETデータセットとV-COCOデータセットに基づいて,HICO-DET-SGとV-COCO-SGという2種類のHOI検出データ分割を新たに作成した。
新しいデータ分割を評価すると、代表HOI検出モデルは元の分割を評価する場合よりもはるかに低性能であった。
これは、系統的な一般化がHOI検出の難しい目標であることを示している。
また, 評価結果を解析することにより, 体系的一般化性能を向上させるための洞察を得るとともに, 4つの今後の研究方向を明らかにする。
新たなデータ分割と解析が,HOI検出における系統的一般化のさらなる研究を促進することを願っている。
関連論文リスト
- Evaluating the Predictive Features of Person-Centric Knowledge Graph Embeddings: Unfolding Ablation Studies [0.757843972001219]
そこで本研究では,MIMIC-IIIデータセットから得られた構造化情報と非構造化情報を用いて学習したGNNモデルの結果を体系的に検証する手法を提案する。
本研究は,PKGにおける読み出し予測の課題に対する予測的特徴の同定におけるこのアプローチの堅牢性を示す。
論文 参考訳(メタデータ) (2024-08-27T09:48:25Z) - Physics Inspired Hybrid Attention for SAR Target Recognition [61.01086031364307]
本稿では,物理にヒントを得たハイブリットアテンション(PIHA)機構と,この問題に対処するためのOFA評価プロトコルを提案する。
PIHAは、物理的情報の高レベルなセマンティクスを活用して、ターゲットの局所的なセマンティクスを認識した特徴群を活性化し、誘導する。
提案手法は,ASCパラメータが同じ12のテストシナリオにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-27T14:39:41Z) - Parallel Reasoning Network for Human-Object Interaction Detection [53.422076419484945]
並列推論ネットワーク(PR-Net)というトランスフォーマーに基づく新しい手法を提案する。
PR-Netは、インスタンスレベルのローカライゼーションと関係レベルの理解のための2つの独立した予測器を構築する。
我々のPR-NetはHICO-DETとV-COCOベンチマークで競合する結果を得た。
論文 参考訳(メタデータ) (2023-01-09T17:00:34Z) - A Skeleton-aware Graph Convolutional Network for Human-Object
Interaction Detection [14.900704382194013]
そこで我々は,SGCN4HOIという人-物間相互作用検出のためのスケルトン対応グラフ畳み込みネットワークを提案する。
我々のネットワークは、人間のキーポイントとオブジェクトキーポイントの間の空間的接続を利用して、グラフの畳み込みによるきめ細かい構造的相互作用を捉えます。
このような幾何学的特徴と視覚的特徴と、人間と物体のペアから得られる空間的構成特徴を融合させる。
論文 参考訳(メタデータ) (2022-07-11T15:20:18Z) - On Generalisability of Machine Learning-based Network Intrusion
Detection Systems [0.0]
本稿では,4つのベンチマークNIDSデータセットを用いて,教師付き学習モデルと教師なし学習モデルの評価を行う。
我々の調査は、検討されたモデルのうちどのモデルもすべての研究されたデータセットを一般化できないことを示唆している。
また,本研究では,教師なし学習手法が,検討シナリオにおける教師付き学習モデルよりも一般化されていることも示唆した。
論文 参考訳(メタデータ) (2022-05-09T08:26:48Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z) - DRG: Dual Relation Graph for Human-Object Interaction Detection [65.50707710054141]
人-物間相互作用(HOI)検出の課題に対処する。
既存の方法は、人間と物体の対の相互作用を独立に認識するか、複雑な外観に基づく共同推論を行う。
本稿では,抽象的空間意味表現を活用して,各対象対を記述し,二重関係グラフを用いてシーンの文脈情報を集約する。
論文 参考訳(メタデータ) (2020-08-26T17:59:40Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。