論文の概要: Learning Adaptive Node Selection with External Attention for Human Interaction Recognition
- arxiv url: http://arxiv.org/abs/2507.03936v1
- Date: Sat, 05 Jul 2025 07:47:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.945647
- Title: Learning Adaptive Node Selection with External Attention for Human Interaction Recognition
- Title(参考訳): ヒューマンインタラクション認識のための外部注意を用いた適応ノード選択学習
- Authors: Chen Pang, Xuequan Lu, Qianyu Zhou, Lei Lyu,
- Abstract要約: ほとんどのGCNベースの手法は、個人を独立したグラフとして相互作用させ、固有の相互依存を無視している。
本研究では,外部注意ネットワークを用いたアクティブノード選択(ASEA)を提案する。
本手法は,各個人がGCNを用いて個人内関係を把握し,行動の詳細な表現を容易にする。
- 参考スコア(独自算出の注目度): 11.88304209222785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most GCN-based methods model interacting individuals as independent graphs, neglecting their inherent inter-dependencies. Although recent approaches utilize predefined interaction adjacency matrices to integrate participants, these matrices fail to adaptively capture the dynamic and context-specific joint interactions across different actions. In this paper, we propose the Active Node Selection with External Attention Network (ASEA), an innovative approach that dynamically captures interaction relationships without predefined assumptions. Our method models each participant individually using a GCN to capture intra-personal relationships, facilitating a detailed representation of their actions. To identify the most relevant nodes for interaction modeling, we introduce the Adaptive Temporal Node Amplitude Calculation (AT-NAC) module, which estimates global node activity by combining spatial motion magnitude with adaptive temporal weighting, thereby highlighting salient motion patterns while reducing irrelevant or redundant information. A learnable threshold, regularized to prevent extreme variations, is defined to selectively identify the most informative nodes for interaction modeling. To capture interactions, we design the External Attention (EA) module to operate on active nodes, effectively modeling the interaction dynamics and semantic relationships between individuals. Extensive evaluations show that our method captures interaction relationships more effectively and flexibly, achieving state-of-the-art performance.
- Abstract(参考訳): ほとんどのGCNベースの手法は、個人を独立したグラフとして相互作用させ、固有の相互依存を無視している。
近年のアプローチでは、事前定義された相互作用隣接行列を用いて参加者を統合するが、これらの行列は異なるアクション間での動的および文脈特異的な結合相互作用を適応的に捉えることができない。
本稿では,外部注意ネットワークを用いたアクティブノード選択(ASEA)を提案する。
本手法は,各個人がGCNを用いて個人内関係を把握し,行動の詳細な表現を容易にする。
相互作用モデリングにおいて最も関連性の高いノードを特定するために,空間運動の大きさを適応時間重み付けと組み合わせてグローバルノードのアクティビティを推定する適応時間ノード振幅計算(AT-NAC)モジュールを導入する。
学習可能な閾値は、極端な変動を防ぐために正規化され、相互作用モデリングのための最も情報性の高いノードを選択的に識別するために定義される。
インタラクションをキャプチャするために,アクティブノード上で動作するための外部意図(EA)モジュールを設計し,個人間のインタラクションのダイナミクスと意味的関係を効果的にモデル化する。
本手法は, より効率的かつ柔軟に相互作用関係を捕捉し, 最先端の性能を達成できることを示す。
関連論文リスト
- Visual-Geometric Collaborative Guidance for Affordance Learning [63.038406948791454]
本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。
本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文 参考訳(メタデータ) (2024-10-15T07:35:51Z) - Learning Mutual Excitation for Hand-to-Hand and Human-to-Human Interaction Recognition [21.007782102151282]
相互励起グラフ畳み込み層を積み重ねた相互励起グラフ畳み込みネットワーク(me-GCN)を提案する。
Me-GCは各レイヤとグラフ畳み込み操作の各ステージで相互情報を学習する。
提案するme-GCは,最先端GCN法およびTransformer法より優れている。
論文 参考訳(メタデータ) (2024-02-04T10:00:00Z) - Interactive Spatiotemporal Token Attention Network for Skeleton-based
General Interactive Action Recognition [8.513434732050749]
本稿では,空間的,時間的,対話的な関係を同時にモデル化する対話型時空間意識ネットワーク(ISTA-Net)を提案する。
我々のネットワークには対話的時空間トークン(IST)を分割するトークン機構があり、これは複数の多様なエンティティの動作を表現する統一的な方法である。
ISTの3次元に沿って共同学習するために、3次元畳み込みと統合されたマルチヘッド自己認識ブロックは、トークン間の相関を捉えるように設計されている。
論文 参考訳(メタデータ) (2023-07-14T16:51:25Z) - Boundary-aware Supervoxel-level Iteratively Refined Interactive 3D Image
Segmentation with Multi-agent Reinforcement Learning [33.181732857907384]
我々は,マルコフ決定プロセス(MDP)を用いた対話型画像分割をモデル化し,強化学習(RL)による解法を提案する。
ボクセル単位の予測のための大規模な探索空間を考えると, エージェント間でボクセルレベルポリシーを共有するマルチエージェント強化学習が採用されている。
4つのベンチマークデータセットによる実験結果から,提案手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-03-19T15:52:56Z) - Learning Self-Modulating Attention in Continuous Time Space with
Applications to Sequential Recommendation [102.24108167002252]
本稿では,複雑で非線形に進化する動的ユーザの嗜好をモデル化する,自己変調型注意ネットワークを提案する。
提案手法がトップNシーケンシャルなレコメンデーションタスクに与える影響を実証的に示すとともに,3つの大規模実世界のデータセットによる結果から,我々のモデルが最先端のパフォーマンスを達成できることを示す。
論文 参考訳(メタデータ) (2022-03-30T03:54:11Z) - Spatio-Temporal Dynamic Inference Network for Group Activity Recognition [7.007702816885332]
グループ活動は、その問題を解決するために人々のグループが行う活動を理解することを目的としている。
従来の手法は、人固有のコンテキストを無視する事前定義されたグラフの推論において制限される。
本稿では、動的関係(DR)モジュールと動的ウォーク(DW)モジュールで構成される動的推論ネットワーク(DIN)を提案する。
論文 参考訳(メタデータ) (2021-08-26T12:40:20Z) - Modeling long-term interactions to enhance action recognition [81.09859029964323]
本稿では,フレームレベルと時間レベルの両方でオブジェクト間の相互作用のセマンティクスを利用する,エゴセントリックなビデオのアンダースタンドアクションに対する新しいアプローチを提案する。
ユーザの手とほぼ対応するプライマリ領域と、相互作用するオブジェクトに対応する可能性のあるセカンダリ領域のセットを入力として、領域ベースのアプローチを使用する。
提案手法は, 標準ベンチマークの動作認識において, 最先端技術よりも優れている。
論文 参考訳(メタデータ) (2021-04-23T10:08:15Z) - Learning Asynchronous and Sparse Human-Object Interaction in Videos [56.73059840294019]
Asynchronous-Sparse Interaction Graph Networks(ASSIGN)は、ビデオシーン内のエンティティに関連するインタラクションイベントの構造を自動的に検出します。
ASSIGNは人間と物体の相互作用認識において試験され、人間のサブアクティビティのセグメンテーションおよびラベル付けにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-03T23:43:55Z) - Pose And Joint-Aware Action Recognition [87.4780883700755]
本稿では,まず,共有動作エンコーダを用いて各関節の動作特徴を別々に抽出する,関節に基づく動作認識の新しいモデルを提案する。
私たちのジョイントセレクタモジュールは、そのタスクの最も識別性の高いジョイントを選択するために、ジョイント情報を再重み付けします。
JHMDB, HMDB, Charades, AVA アクション認識データセットにおける最先端のジョイントベースアプローチに対する大きな改善点を示す。
論文 参考訳(メタデータ) (2020-10-16T04:43:34Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。