論文の概要: Incremental Human-Object Interaction Detection with Invariant Relation Representation Learning
- arxiv url: http://arxiv.org/abs/2510.27020v1
- Date: Thu, 30 Oct 2025 21:59:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:15.922485
- Title: Incremental Human-Object Interaction Detection with Invariant Relation Representation Learning
- Title(参考訳): 不変関係表現学習を用いたインクリメンタルヒューマン・オブジェクトインタラクション検出
- Authors: Yana Wei, Zeen Chi, Chongyu Wang, Yu Wu, Shipeng Yan, Yongfei Liu, Xuming He,
- Abstract要約: オープンワールド環境では、人間と物体の相互作用(HOI)は連続的に進化し、従来のクローズドワールドのHOI検出モデルに挑戦する。
人間の知識獲得能力にインスパイアされた我々は、段階的HOI検出(IHOID)を探求し、このような動的環境における人間と物体の関係を識別できるエージェントを開発する。
IRDはオブジェクトと関係の学習を分離し、同じ関係を持つ異なるHOIの組み合わせで不変な関係の特徴を学習するための2つのユニークな蒸留損失を導入する。
- 参考スコア(独自算出の注目度): 24.134958315913888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In open-world environments, human-object interactions (HOIs) evolve continuously, challenging conventional closed-world HOI detection models. Inspired by humans' ability to progressively acquire knowledge, we explore incremental HOI detection (IHOID) to develop agents capable of discerning human-object relations in such dynamic environments. This setup confronts not only the common issue of catastrophic forgetting in incremental learning but also distinct challenges posed by interaction drift and detecting zero-shot HOI combinations with sequentially arriving data. Therefore, we propose a novel exemplar-free incremental relation distillation (IRD) framework. IRD decouples the learning of objects and relations, and introduces two unique distillation losses for learning invariant relation features across different HOI combinations that share the same relation. Extensive experiments on HICO-DET and V-COCO datasets demonstrate the superiority of our method over state-of-the-art baselines in mitigating forgetting, strengthening robustness against interaction drift, and generalization on zero-shot HOIs. Code is available at \href{https://github.com/weiyana/ContinualHOI}{this HTTP URL}
- Abstract(参考訳): オープンワールド環境では、人間と物体の相互作用(HOI)は連続的に進化し、従来のクローズドワールドのHOI検出モデルに挑戦する。
人間の知識獲得能力にインスパイアされた我々は、段階的HOI検出(IHOID)を探求し、このような動的環境における人間と物体の関係を識別できるエージェントを開発する。
このセットアップは、漸進的な学習における破滅的な忘れ込みの一般的な問題に直面するだけでなく、相互作用のドリフトや、逐次到着したデータとのゼロショットHOIの組み合わせの検出によって引き起こされる別の課題にも直面している。
そこで本研究では, 新規な非常用インクリメンタルリレーション蒸留(IRD)フレームワークを提案する。
IRDは、オブジェクトと関係の学習を分離し、同じ関係を持つ異なるHOIの組み合わせ間で不変な関係性を学ぶために、2つのユニークな蒸留損失を導入する。
HICO-DET と V-COCO データセットの大規模な実験は、忘れを緩和し、相互作用ドリフトに対する堅牢性を強化し、ゼロショットHOI 上での一般化において、我々の手法が最先端のベースラインよりも優れていることを示す。
コードは \href{https://github.com/weiyana/ContinualHOI}{this HTTP URL} で入手できる。
関連論文リスト
- Learning Human-Object Interaction as Groups [52.28258599873394]
GroupHOIは、幾何学的近接性および意味的類似性の観点から文脈情報を伝播するフレームワークである。
これは、より困難な非言語間相互作用検出タスクにおいて、主要なパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-10-21T07:25:10Z) - Funnel-HOI: Top-Down Perception for Zero-Shot HOI Detection [3.656114607436271]
人間オブジェクトの相互作用検出(Human-object Interaction Detection, HOID)とは、画像中の対話的な人間オブジェクトのペアをローカライズし、その相互作用を識別することである。
本研究では,Funnel-HOIというトップダウンフレームワークを構築した。
新規な非対称なコアテンション機構は、マルチモーダル情報(ゼロショット機能を含む)を利用してこれらのキューをマイニングし、エンコーダレベルでより強力な相互作用表現を生成する。
論文 参考訳(メタデータ) (2025-07-16T20:47:24Z) - Reinforced Interactive Continual Learning via Real-time Noisy Human Feedback [59.768119380109084]
本稿では,AIモデルがリアルタイムフィードバックから新たなスキルを動的に学習する対話型連続学習パラダイムを提案する。
大規模言語モデル(LLM)を活用した強化型対話型連続学習フレームワークRiCLを提案する。
我々のRiCLアプローチは、最先端のオンライン連続学習とノイズラベル学習の既存の組み合わせを大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-15T03:22:03Z) - Visual-Geometric Collaborative Guidance for Affordance Learning [63.038406948791454]
本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。
本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文 参考訳(メタデータ) (2024-10-15T07:35:51Z) - Neural-Logic Human-Object Interaction Detection [67.4993347702353]
本稿では,ニューラルロジック推論を利用した新しいHOI検出器であるL OGIC HOIと,実体間の相互作用を推測するTransformerを提案する。
具体的には,バニラトランスフォーマーの自己保持機構を改変し,人間,行動,対象>三重項を推論し,新たな相互作用を構成する。
我々はこれらの2つの特性を一階述語論理で定式化し、それらを連続空間に基底にして、我々のアプローチの学習過程を制約し、性能とゼロショットの一般化能力を向上させる。
論文 参考訳(メタデータ) (2023-11-16T11:47:53Z) - Understanding Augmentation-based Self-Supervised Representation Learning
via RKHS Approximation and Regression [53.15502562048627]
最近の研究は、自己教師付き学習とグラフラプラシアン作用素のトップ固有空間の近似との関係を構築している。
この研究は、増強に基づく事前訓練の統計的分析に発展する。
論文 参考訳(メタデータ) (2023-06-01T15:18:55Z) - EiHi Net: Out-of-Distribution Generalization Paradigm [6.6157730528755065]
EiHi netは、どんな視覚的バックボーンでも祝福できるモデル学習パラダイムである。
本稿では,ディープラーニングにおけるOoD(Out-of-distriion)の一般化問題を解決するために,新しいEeiHiネットを開発した。
論文 参考訳(メタデータ) (2022-09-29T17:08:12Z) - RR-Net: Injecting Interactive Semantics in Human-Object Interaction
Detection [40.65483058890176]
最新のエンドツーエンドHOI検出器は関係推論に欠けており、予測のためにHOI固有の対話的セマンティクスを学習できない。
まず、インタラクション推論のための新しい構造とパラメータ共有パターンをもたらす、プログレッシブな関係認識フレームを提案する。
上記のモジュールに基づいて、Relation Reasoning Network (abbr) というエンドツーエンドのトレーニング可能なフレームワークを構築します。
RR-Net)
論文 参考訳(メタデータ) (2021-04-30T14:03:10Z) - RobustFusion: Robust Volumetric Performance Reconstruction under
Human-object Interactions from Monocular RGBD Stream [27.600873320989276]
現実のシナリオでは、さまざまなオブジェクトと複雑な相互作用を持つ人間のパフォーマンスの高品質の4D再構築が不可欠です。
近年の進歩は、信頼性の高い性能回復には至っていない。
人間と物体のインタラクションシナリオのための堅牢なボリュームパフォーマンス再構築システムであるRobustFusionを提案する。
論文 参考訳(メタデータ) (2021-04-30T08:41:45Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。